- תיאור :
CBIS-DDSM (Curated Breast Imaging Subset של DDSM) הוא גרסה מעודכנת וסטנדרטית של מסד הנתונים הדיגיטלי להקרנת ממוגרפיה (DDSM). ה-DDSM הוא מסד נתונים של 2,620 מחקרי ממוגרפיה של סרטים סרוקים. הוא מכיל מקרים נורמליים, שפירים וממאירים עם מידע פתולוגי מאומת.
תצורת ברירת המחדל מורכבת מטלאים שחולצו מהממוגרפיה המקורית, בעקבות התיאור מ- ( http://arxiv.org/abs/1708.09427 ), על מנת למסגר את המשימה לפתרון בהגדרת סיווג תמונה מסורתית.
דף הבית : https://wiki.cancerimagingarchive.net/display/Public/CBIS-DDSM
קוד מקור :
tfds.image_classification.CuratedBreastImagingDDSM
גרסאות :
-
2.0.1
: API חדש מפוצל ( https://tensorflow.org/datasets/splits ) -
3.0.0
(ברירת מחדל): דגימת חיתוך טובה יותר ( https://github.com/tensorflow/datasets/pull/2502 )
-
הוראות הורדה ידניות : מערך נתונים זה מחייב אותך להוריד את נתוני המקור באופן ידני אל
download_config.manual_dir
(ברירת המחדל היא~/tensorflow_datasets/downloads/manual/
):
אתה יכול להוריד את התמונות מ https://wiki.cancerimagingarchive.net/display/Public/CBIS-DDSM
מכיוון שדרושות תוכנות וספריות מיוחדות כדי להוריד ולקרוא את התמונות הכלולות במערך הנתונים, TFDS מניח שהמשתמש הוריד את קבצי ה-DCIM המקוריים והמיר אותם ל-PNG.
יש להשתמש בפקודות הבאות (או שווה ערך) ליצירת קבצי PNG, על מנת להבטיח תוצאות ניתנות לשחזור:
find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'
יש לשים את התמונות המתקבלות ב- manual_dir
, כמו: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png
.
שמירה אוטומטית במטמון ( תיעוד ): לא
מפתחות בפיקוח (ראה
as_supervised
doc ):None
ציטוט :
@misc{CBIS_DDSM_Citation,
doi = {10.7937/k9/tcia.2016.7o02s9cy},
url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
author = {Sawyer-Lee, Rebecca and Gimenez, Francisco and Hoogi, Assaf and Rubin, Daniel},
title = {Curated Breast Imaging Subset of DDSM},
publisher = {The Cancer Imaging Archive},
year = {2016},
}
@article{TCIA_Citation,
author = {
K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
L. Tarbox and F. Prior
},
title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
Public Information Repository} },
journal = {Journal of Digital Imaging},
volume = {26},
month = {December},
year = {2013},
pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
author = {Li Shen},
title = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
An All Convolutional Design},
journal = {CoRR},
volume = {abs/1708.09427},
year = {2017},
url = {http://arxiv.org/abs/1708.09427},
archivePrefix = {arXiv},
eprint = {1708.09427},
timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
biburl = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
bibsource = {dblp computer science bibliography, https://dblp.org}
}
curated_breast_imaging_ddsm/patches (תצורת ברירת המחדל)
תיאור תצורה : טלאים המכילים גם מקרי קלסיפיקציה וגם מקרים המוניים, בתוספת נתיבים ללא חריגות. עוצב כמשימת סיווג מסורתית בת 5 כיתות.
גודל הורדה :
2.01 MiB
גודל מערך נתונים :
801.46 MiB
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 9,770 |
'train' | 49,780 |
'validation' | 5,580 |
- מבנה תכונה :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
תְעוּדַת זֶהוּת | טֶקסט | חוּט | ||
תמונה | תמונה | (אין, אין, 1) | uint8 | |
תווית | ClassLabel | int64 |
- איור ( tfds.show_examples ):
- דוגמאות ( tfds.as_dataframe ):
curated_breast_imaging_ddsm/original-calc
תיאור תצורה : תמונות מקוריות של מקרי ההסתיידות דחוסים ב-PNG ללא אובדן.
גודל הורדה :
1.06 MiB
גודל ערכת נתונים :
4.42 GiB
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 284 |
'train' | 1,227 |
- מבנה תכונה :
FeaturesDict({
'abnormalities': Sequence({
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
'id': int32,
'mask': Image(shape=(None, None, 1), dtype=uint8),
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'patient': Text(shape=(), dtype=string),
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
חריגות | סדר פעולות | |||
חריגות/הערכה | ClassLabel | int64 | ||
חריגות/התפלגות_calc | ClassLabel | int64 | ||
abnormalities/calc_type | ClassLabel | int64 | ||
חריגות/מזהה | מוֹתֵחַ | int32 | ||
חריגות/מסכה | תמונה | (אין, אין, 1) | uint8 | |
חריגות/פתולוגיה | ClassLabel | int64 | ||
חריגות/עדינות | ClassLabel | int64 | ||
שד | ClassLabel | int64 | ||
תְעוּדַת זֶהוּת | טֶקסט | חוּט | ||
תמונה | תמונה | (אין, אין, 1) | uint8 | |
סבלני | טֶקסט | חוּט | ||
נוף | ClassLabel | int64 |
- איור ( tfds.show_examples ):
- דוגמאות ( tfds.as_dataframe ):
curated_breast_imaging_ddsm/original-mass
תיאור תצורה : תמונות מקוריות של המארזים ההמוניים דחוסים ב-PNG ללא אובדן.
גודל הורדה :
966.57 KiB
גודל מערך נתונים :
4.80 GiB
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 348 |
'train' | 1,166 |
- מבנה תכונה :
FeaturesDict({
'abnormalities': Sequence({
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
'id': int32,
'mask': Image(shape=(None, None, 1), dtype=uint8),
'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'patient': Text(shape=(), dtype=string),
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
חריגות | סדר פעולות | |||
חריגות/הערכה | ClassLabel | int64 | ||
חריגות/מזהה | מוֹתֵחַ | int32 | ||
חריגות/מסכה | תמונה | (אין, אין, 1) | uint8 | |
חריגות/שולי_מסה | ClassLabel | int64 | ||
חריגות/צורת_מסה | ClassLabel | int64 | ||
חריגות/פתולוגיה | ClassLabel | int64 | ||
חריגות/עדינות | ClassLabel | int64 | ||
שד | ClassLabel | int64 | ||
תְעוּדַת זֶהוּת | טֶקסט | חוּט | ||
תמונה | תמונה | (אין, אין, 1) | uint8 | |
סבלני | טֶקסט | חוּט | ||
נוף | ClassLabel | int64 |
- איור ( tfds.show_examples ):
- דוגמאות ( tfds.as_dataframe ):