لدي سؤال؟ تواصل مع المجتمع في منتدى زيارة منتدى TensorFlow

curated_breast_imaging_ddsm

CBIS-DDSM (مجموعة فرعية من تصوير الثدي المنسق لـ DDSM) هي نسخة محدثة وموحدة من قاعدة البيانات الرقمية لفحص التصوير الشعاعي للثدي (DDSM). DDSM هي قاعدة بيانات تضم 2620 دراسة تصوير شعاعي للثدي تم مسحها ضوئيًا. يحتوي على حالات طبيعية وحميدة وخبيثة مع معلومات مرضية تم التحقق منها.

يتكون التكوين الافتراضي من رقع مستخرجة من صور الثدي الشعاعية الأصلية ، باتباع الوصف من http://arxiv.org/abs/1708.09427 ، من أجل تأطير المهمة لحلها في إعداد تصنيف تقليدي للصور.

نظرًا لضرورة وجود برامج ومكتبات خاصة لتنزيل الصور الموجودة في مجموعة البيانات وقراءتها ، تفترض TFDS أن المستخدم قد قام بتنزيل ملفات DCIM الأصلية وتحويلها إلى PNG.

يجب استخدام الأوامر التالية (أو ما يعادلها) لإنشاء ملفات PNG لضمان نتائج قابلة للتكرار:

find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'

يجب وضع الصور الناتجة في manual_dir مثل: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png

@misc{CBIS_DDSM_Citation,
  doi = {10.7937/k9/tcia.2016.7o02s9cy},
  url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
  author = {Sawyer-Lee,  Rebecca and Gimenez,  Francisco and Hoogi,  Assaf and Rubin,  Daniel},
  title = {Curated Breast Imaging Subset of DDSM},
  publisher = {The Cancer Imaging Archive},
  year = {2016},
}
@article{TCIA_Citation,
  author = {
    K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
    P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
    L. Tarbox and F. Prior
  },
  title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
  Public Information Repository} },
  journal = {Journal of Digital Imaging},
  volume = {26},
  month = {December},
  year = {2013},
  pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
  author    = {Li Shen},
  title     = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
               An All Convolutional Design},
  journal   = {CoRR},
  volume    = {abs/1708.09427},
  year      = {2017},
  url       = {http://arxiv.org/abs/1708.09427},
  archivePrefix = {arXiv},
  eprint    = {1708.09427},
  timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

curated_breast_imaging_ddsm / patches (التكوين الافتراضي)

  • وصف التكوين : بقع تحتوي على كل من حالات التكلس والجماعية ، بالإضافة إلى المسارات التي لا تحتوي على تشوهات. تم تصميمه كمهمة تصنيف تقليدية من 5 فئات.

  • حجم التحميل : 2.01 MiB

  • حجم مجموعة البيانات : 801.46 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 9770
'train' 49780
'validation' 5،580
  • الميزات :
FeaturesDict({
    'id': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 1), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
})

التصور

curated_breast_imaging_ddsm / original-calc

  • وصف التكوين : الصور الأصلية لحالات التكلس مضغوطة في PNG بدون فقدان بيانات.

  • حجم التحميل : 1.06 MiB

  • حجم مجموعة البيانات : 4.42 GiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 284
'train' 1،227
  • الميزات :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
        'calc_distribution': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
        'calc_type': ClassLabel(shape=(), dtype=tf.int64, num_classes=48),
        'id': tf.int32,
        'mask': Image(shape=(None, None, 1), dtype=tf.uint8),
        'pathology': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'id': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 1), dtype=tf.uint8),
    'patient': Text(shape=(), dtype=tf.string),
    'view': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
})

التصور

curated_breast_imaging_ddsm / original-mass

  • وصف التكوين : الصور الأصلية للحالات الكبيرة مضغوطة في PNG بدون فقدان بيانات.

  • حجم التحميل : 966.57 KiB

  • حجم مجموعة البيانات : 4.80 GiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 348
'train' 1166
  • الميزات :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
        'id': tf.int32,
        'mask': Image(shape=(None, None, 1), dtype=tf.uint8),
        'mass_margins': ClassLabel(shape=(), dtype=tf.int64, num_classes=20),
        'mass_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=21),
        'pathology': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'id': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 1), dtype=tf.uint8),
    'patient': Text(shape=(), dtype=tf.string),
    'view': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
})

التصور