- توضیحات :
CBIS-DDSM (زیر مجموعه تصویربرداری پستان از DDSM) نسخه به روز شده و استاندارد شده پایگاه داده دیجیتال برای انجام ماموگرافی غربالگری (DDSM) است. DDSM یک پایگاه داده از 2،620 مطالعه ماموگرافی فیلم اسکن شده است. این شامل موارد طبیعی ، خوش خیم و بدخیم با اطلاعات آسیب شناسی تأیید شده است.
پیکربندی پیش فرض از وصله های استخراج شده از ماموگرافی های اصلی ، به شرح شرح http://arxiv.org/abs/1708.09427 ساخته شده است ، به منظور چارچوب کار برای حل در یک تنظیم طبقه بندی تصویر سنتی.
صفحه اصلی : https://wiki.cancerimagingarchive.net/display/Public/CBIS-DDSM
کد منبع :
tfds.image_classification.CuratedBreastImagingDDSM
نسخه ها :
-
2.0.1
: API جدید تقسیم شده ( https://tensorflow.org/datasets/splits ) -
3.0.0
(پیش فرض): نمونه برداری بهتر از محصول ( https://github.com/tensorflow/datasets/pull/2502 )
-
دستورالعمل های بارگیری دستی : برای این مجموعه داده لازم است که داده های منبع را به صورت دستی در
download_config.manual_dir
(به طور پیش فرض~/tensorflow_datasets/downloads/manual/
):
می توانید تصاویر را از https://wiki.cancerimagingarchive.net/display/Public/CBIS-DDSM بارگیری کنید.
از آنجا که برای بارگیری و خواندن تصاویر موجود در مجموعه داده ، به نرم افزار و کتابخانه خاصی نیاز است ، TFDS فرض می کند که کاربر پرونده های اصلی DCIM را بارگیری کرده و به PNG تبدیل کرده است.
از دستورات زیر (یا معادل آن) باید برای تولید فایل های PNG استفاده شود تا نتایج قابل تکرار تضمین شود:
find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'
تصاویر حاصل باید در manual_dir
قرار داده شود ، مانند: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png
.
ذخیره خودکار ( مستندات ): خیر
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):None
نقل قول :
@misc{CBIS_DDSM_Citation,
doi = {10.7937/k9/tcia.2016.7o02s9cy},
url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
author = {Sawyer-Lee, Rebecca and Gimenez, Francisco and Hoogi, Assaf and Rubin, Daniel},
title = {Curated Breast Imaging Subset of DDSM},
publisher = {The Cancer Imaging Archive},
year = {2016},
}
@article{TCIA_Citation,
author = {
K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
L. Tarbox and F. Prior
},
title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
Public Information Repository} },
journal = {Journal of Digital Imaging},
volume = {26},
month = {December},
year = {2013},
pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
author = {Li Shen},
title = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
An All Convolutional Design},
journal = {CoRR},
volume = {abs/1708.09427},
year = {2017},
url = {http://arxiv.org/abs/1708.09427},
archivePrefix = {arXiv},
eprint = {1708.09427},
timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
biburl = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
bibsource = {dblp computer science bibliography, https://dblp.org}
}
crated_breast_imaging_ddsm / patch ها (پیکربندی پیش فرض)
توضیحات پیکربندی : وصله های حاوی هر دو حالت انعطاف پذیری و موارد توده ای ، به علاوه مسیرهایی بدون هیچ ناهنجاری. به عنوان یک کار طبقه بندی سنتی 5 کلاسه طراحی شده است.
اندازه بارگیری :
2.01 MiB
اندازه مجموعه داده :
801.46 MiB
تقسیم :
شکاف | مثال ها |
---|---|
'test' | 9،770 |
'train' | 49،780 |
'validation' | 5،580 |
- ویژگی ها :
FeaturesDict({
'id': Text(shape=(), dtype=tf.string),
'image': Image(shape=(None, None, 1), dtype=tf.uint8),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
})
- شکل ( tfds.show_examples ):
- مثالها ( tfds.as_dataframe ):
cored_breast_image_ddsm / اصلی-کالک
شرح پیکربندی : تصاویر اصلی از موارد کلسیفیکاسیون فشرده شده در PNG بدون ضرر.
اندازه بارگیری :
1.06 MiB
اندازه مجموعه داده :
4.42 GiB
تقسیم :
شکاف | مثال ها |
---|---|
'test' | 284 |
'train' | 1،227 |
- ویژگی ها :
FeaturesDict({
'abnormalities': Sequence({
'assessment': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
'calc_distribution': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
'calc_type': ClassLabel(shape=(), dtype=tf.int64, num_classes=48),
'id': tf.int32,
'mask': Image(shape=(None, None, 1), dtype=tf.uint8),
'pathology': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'subtlety': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
}),
'breast': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
'id': Text(shape=(), dtype=tf.string),
'image': Image(shape=(None, None, 1), dtype=tf.uint8),
'patient': Text(shape=(), dtype=tf.string),
'view': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
})
- شکل ( tfds.show_examples ):
- مثالها ( tfds.as_dataframe ):
cored_breast_image_ddsm / اصلی-جرم
شرح پیکربندی : تصاویر اصلی از موارد انبوه فشرده شده در PNG بدون ضرر.
اندازه
966.57 KiB
:966.57 KiB
اندازه مجموعه داده :
4.80 GiB
تقسیم :
شکاف | مثال ها |
---|---|
'test' | 348 |
'train' | 1،166 |
- ویژگی ها :
FeaturesDict({
'abnormalities': Sequence({
'assessment': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
'id': tf.int32,
'mask': Image(shape=(None, None, 1), dtype=tf.uint8),
'mass_margins': ClassLabel(shape=(), dtype=tf.int64, num_classes=20),
'mass_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=21),
'pathology': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'subtlety': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
}),
'breast': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
'id': Text(shape=(), dtype=tf.string),
'image': Image(shape=(None, None, 1), dtype=tf.uint8),
'patient': Text(shape=(), dtype=tf.string),
'view': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
})
- شکل ( tfds.show_examples ):
- مثالها ( tfds.as_dataframe ):