curated_breast_imaging_ddsm,curated_breast_imaging_ddsm

CBIS-DDSM (Curated Breast Imaging Subset של DDSM) הוא גרסה מעודכנת וסטנדרטית של מסד הנתונים הדיגיטלי להקרנת ממוגרפיה (DDSM). ה-DDSM הוא מסד נתונים של 2,620 מחקרי ממוגרפיה של סרטים סרוקים. הוא מכיל מקרים נורמליים, שפירים וממאירים עם מידע פתולוגי מאומת.

תצורת ברירת המחדל מורכבת מטלאים שחולצו מהממוגרפיה המקורית, בעקבות התיאור מ- ( http://arxiv.org/abs/1708.09427 ), על מנת למסגר את המשימה לפתרון בהגדרת סיווג תמונה מסורתית.

מכיוון שדרושות תוכנות וספריות מיוחדות כדי להוריד ולקרוא את התמונות הכלולות במערך הנתונים, TFDS מניח שהמשתמש הוריד את קבצי ה-DCIM המקוריים והמיר אותם ל-PNG.

יש להשתמש בפקודות הבאות (או שווה ערך) ליצירת קבצי PNG, על מנת להבטיח תוצאות ניתנות לשחזור:

find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'

יש לשים את התמונות המתקבלות ב- manual_dir , כמו: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png .

  • שמירה אוטומטית במטמון ( תיעוד ): לא

  • מפתחות בפיקוח (ראה as_supervised doc ): None

  • ציטוט :

@misc{CBIS_DDSM_Citation,
  doi = {10.7937/k9/tcia.2016.7o02s9cy},
  url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
  author = {Sawyer-Lee,  Rebecca and Gimenez,  Francisco and Hoogi,  Assaf and Rubin,  Daniel},
  title = {Curated Breast Imaging Subset of DDSM},
  publisher = {The Cancer Imaging Archive},
  year = {2016},
}
@article{TCIA_Citation,
  author = {
    K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
    P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
    L. Tarbox and F. Prior
  },
  title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
  Public Information Repository} },
  journal = {Journal of Digital Imaging},
  volume = {26},
  month = {December},
  year = {2013},
  pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
  author    = {Li Shen},
  title     = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
               An All Convolutional Design},
  journal   = {CoRR},
  volume    = {abs/1708.09427},
  year      = {2017},
  url       = {http://arxiv.org/abs/1708.09427},
  archivePrefix = {arXiv},
  eprint    = {1708.09427},
  timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

curated_breast_imaging_ddsm/patches (תצורת ברירת המחדל)

  • תיאור תצורה : טלאים המכילים גם מקרי קלסיפיקציה וגם מקרים המוניים, בתוספת נתיבים ללא חריגות. עוצב כמשימת סיווג מסורתית בת 5 כיתות.

  • גודל הורדה : 2.01 MiB

  • גודל מערך נתונים : 801.46 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'test' 9,770
'train' 49,780
'validation' 5,580
  • מבנה תכונה :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
תְעוּדַת זֶהוּת טֶקסט חוּט
תמונה תמונה (אין, אין, 1) uint8
תווית ClassLabel int64

רְאִיָה

curated_breast_imaging_ddsm/original-calc

  • תיאור תצורה : תמונות מקוריות של מקרי ההסתיידות דחוסים ב-PNG ללא אובדן.

  • גודל הורדה : 1.06 MiB

  • גודל ערכת נתונים : 4.42 GiB

  • פיצולים :

לְפַצֵל דוגמאות
'test' 284
'train' 1,227
  • מבנה תכונה :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
        'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
חריגות סדר פעולות
חריגות/הערכה ClassLabel int64
חריגות/התפלגות_calc ClassLabel int64
abnormalities/calc_type ClassLabel int64
חריגות/מזהה מוֹתֵחַ int32
חריגות/מסכה תמונה (אין, אין, 1) uint8
חריגות/פתולוגיה ClassLabel int64
חריגות/עדינות ClassLabel int64
שד ClassLabel int64
תְעוּדַת זֶהוּת טֶקסט חוּט
תמונה תמונה (אין, אין, 1) uint8
סבלני טֶקסט חוּט
נוף ClassLabel int64

רְאִיָה

curated_breast_imaging_ddsm/original-mass

  • תיאור תצורה : תמונות מקוריות של המארזים ההמוניים דחוסים ב-PNG ללא אובדן.

  • גודל הורדה : 966.57 KiB

  • גודל מערך נתונים : 4.80 GiB

  • פיצולים :

לְפַצֵל דוגמאות
'test' 348
'train' 1,166
  • מבנה תכונה :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
        'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
חריגות סדר פעולות
חריגות/הערכה ClassLabel int64
חריגות/מזהה מוֹתֵחַ int32
חריגות/מסכה תמונה (אין, אין, 1) uint8
חריגות/שולי_מסה ClassLabel int64
חריגות/צורת_מסה ClassLabel int64
חריגות/פתולוגיה ClassLabel int64
חריגות/עדינות ClassLabel int64
שד ClassLabel int64
תְעוּדַת זֶהוּת טֶקסט חוּט
תמונה תמונה (אין, אין, 1) uint8
סבלני טֶקסט חוּט
נוף ClassLabel int64

רְאִיָה