curated_breast_imaging_ddsm

CBIS-DDSM (קבוצת משנה של הדמיית חזה אוצרת של DDSM) היא גרסה מעודכנת ומתוקננת של מסד הנתונים הדיגיטלי לבדיקת ממוגרפיה (DDSM). ה- DDSM הוא מאגר נתונים של 2,620 מחקרי ממוגרפיה של סרטים סרוקים. הוא מכיל מקרים רגילים, שפירים וממאירים עם מידע פתולוגי מאומת.

את תצורת ברירת המחדל עשויה טלאים שחולצו מן ממוגרפיה המקורי, בעקבות התיאור מן http://arxiv.org/abs/1708.09427, כדי למסגר את המשימה לפתור בסביבת סיווג תמונה מסורתית.

מכיוון שנדרשות תוכנות וספריות מיוחדות כדי להוריד ולקרוא את התמונות הכלולות במערך הנתונים, TFDS מניח שהמשתמש הוריד את קבצי DCIM המקוריים והמיר אותן ל- PNG.

יש להשתמש בפקודות הבאות (או שווה ערך) ליצירת קבצי PNG, על מנת להבטיח תוצאות הניתנות לשחזור:

find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'

התמונות המתקבלות יש לשים manual_dir , כמו: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png .

@misc{CBIS_DDSM_Citation,
  doi = {10.7937/k9/tcia.2016.7o02s9cy},
  url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
  author = {Sawyer-Lee,  Rebecca and Gimenez,  Francisco and Hoogi,  Assaf and Rubin,  Daniel},
  title = {Curated Breast Imaging Subset of DDSM},
  publisher = {The Cancer Imaging Archive},
  year = {2016},
}
@article{TCIA_Citation,
  author = {
    K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
    P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
    L. Tarbox and F. Prior
  },
  title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
  Public Information Repository} },
  journal = {Journal of Digital Imaging},
  volume = {26},
  month = {December},
  year = {2013},
  pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
  author    = {Li Shen},
  title     = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
               An All Convolutional Design},
  journal   = {CoRR},
  volume    = {abs/1708.09427},
  year      = {2017},
  url       = {http://arxiv.org/abs/1708.09427},
  archivePrefix = {arXiv},
  eprint    = {1708.09427},
  timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

curated_breast_imaging_ddsm/patches (ברירת מחדל)

  • תיאור Config: תיקונים המכילים גם calsification ומקרים המוניים, בתוספת pathces ללא הפרעות. מעוצב כמשימת סיווג מסורתית של 5 מחלקות.

  • גודל ההורדה: 2.01 MiB

  • מערך נתונים גודל: 801.46 MiB

  • פיצולים:

לְפַצֵל דוגמאות
'test' 9,770
'train' 49,780
'validation' 5,580
  • מאפיינים:
FeaturesDict({
    'id': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 1), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
})

רְאִיָה

curated_breast_imaging_ddsm/original-calc

  • תיאור Config: תמונות מקוריות של המקרים הסתיידות דחוס PNG lossless.

  • גודל ההורדה: 1.06 MiB

  • גודל בסיס הנתונים: 4.42 GiB

  • פיצולים:

לְפַצֵל דוגמאות
'test' 284
'train' 1,227
  • מאפיינים:
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
        'calc_distribution': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
        'calc_type': ClassLabel(shape=(), dtype=tf.int64, num_classes=48),
        'id': tf.int32,
        'mask': Image(shape=(None, None, 1), dtype=tf.uint8),
        'pathology': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'id': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 1), dtype=tf.uint8),
    'patient': Text(shape=(), dtype=tf.string),
    'view': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
})

רְאִיָה

curated_breast_imaging_ddsm/original-mass

  • תיאור Config: תמונות מקוריות של המקרים ההמוניים דחוס PNG lossless.

  • גודל ההורדה: 966.57 KiB

  • גודל בסיס הנתונים: 4.80 GiB

  • פיצולים:

לְפַצֵל דוגמאות
'test' 348
'train' 1,166
  • מאפיינים:
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
        'id': tf.int32,
        'mask': Image(shape=(None, None, 1), dtype=tf.uint8),
        'mass_margins': ClassLabel(shape=(), dtype=tf.int64, num_classes=20),
        'mass_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=21),
        'pathology': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'id': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 1), dtype=tf.uint8),
    'patient': Text(shape=(), dtype=tf.string),
    'view': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
})

רְאִיָה