एमएल समुदाय दिवस 9 नवंबर है! TensorFlow, JAX से नई जानकारी के लिए हमसे जुड़ें, और अधिक जानें

क्यूरेटेड_ब्रेस्ट_इमेजिंग_डीडीएसएम

सीबीआईएस-डीडीएसएम (डीडीएसएम का क्यूरेटेड ब्रेस्ट इमेजिंग सबसेट) स्क्रीनिंग मैमोग्राफी (डीडीएसएम) के लिए डिजिटल डेटाबेस का एक अद्यतन और मानकीकृत संस्करण है। डीडीएसएम 2,620 स्कैन की गई फिल्म मैमोग्राफी अध्ययनों का एक डेटाबेस है। इसमें सत्यापित पैथोलॉजी जानकारी के साथ सामान्य, सौम्य और घातक मामले शामिल हैं।

डिफ़ॉल्ट config मूल मैमोग्राम से निकाला पैच से बना है, से वर्णन निम्नलिखित , http://arxiv.org/abs/1708.09427 आदेश में एक पारंपरिक छवि वर्गीकरण की स्थापना में हल करने के लिए कार्य फ्रेम करने के लिए में।

चूंकि डेटासेट में निहित छवियों को डाउनलोड करने और पढ़ने के लिए विशेष सॉफ्टवेयर और पुस्तकालयों की आवश्यकता होती है, टीएफडीएस मानता है कि उपयोगकर्ता ने मूल डीसीआईएम फाइलों को डाउनलोड किया है और उन्हें पीएनजी में परिवर्तित कर दिया है।

प्रतिलिपि प्रस्तुत करने योग्य परिणामों की गारंटी के लिए, पीएनजी फाइलों को उत्पन्न करने के लिए निम्नलिखित आदेशों (या समकक्ष) का उपयोग किया जाना चाहिए:

find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'

जिसके परिणामस्वरूप छवियों में रखा जाना चाहिए manual_dir , जैसे: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png

@misc{CBIS_DDSM_Citation,
  doi = {10.7937/k9/tcia.2016.7o02s9cy},
  url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
  author = {Sawyer-Lee,  Rebecca and Gimenez,  Francisco and Hoogi,  Assaf and Rubin,  Daniel},
  title = {Curated Breast Imaging Subset of DDSM},
  publisher = {The Cancer Imaging Archive},
  year = {2016},
}
@article{TCIA_Citation,
  author = {
    K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
    P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
    L. Tarbox and F. Prior
  },
  title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
  Public Information Repository} },
  journal = {Journal of Digital Imaging},
  volume = {26},
  month = {December},
  year = {2013},
  pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
  author    = {Li Shen},
  title     = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
               An All Convolutional Design},
  journal   = {CoRR},
  volume    = {abs/1708.09427},
  year      = {2017},
  url       = {http://arxiv.org/abs/1708.09427},
  archivePrefix = {arXiv},
  eprint    = {1708.09427},
  timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

क्यूरेटेड_ब्रेस्ट_इमेजिंग_डीडीएसएम/पैच (डिफ़ॉल्ट कॉन्फिग)

  • कॉन्फ़िग विवरण: पैच कोई असामान्यताएं के साथ दोनों calsification और बड़े पैमाने पर मामलों के अलावा pathces हैं। पारंपरिक 5-वर्ग वर्गीकरण कार्य के रूप में डिज़ाइन किया गया।

  • डाउनलोड का आकार: 2.01 MiB

  • डेटासेट का आकार: 801.46 MiB

  • विभाजन:

विभाजित करना उदाहरण
'test' 9,770
'train' 49,780
'validation' 5,580
  • विशेषताएं:
FeaturesDict({
    'id': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 1), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
})

VISUALIZATION

क्यूरेटेड_ब्रेस्ट_इमेजिंग_डीडीएसएम/ओरिजिनल-कैल्क

  • कॉन्फ़िग विवरण: दोषरहित पीएनजी में संकुचित कड़ा हो जाना मामलों की मूल छवियों।

  • डाउनलोड का आकार: 1.06 MiB

  • डेटासेट का आकार: 4.42 GiB

  • विभाजन:

विभाजित करना उदाहरण
'test' २८४
'train' 1,227
  • विशेषताएं:
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
        'calc_distribution': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
        'calc_type': ClassLabel(shape=(), dtype=tf.int64, num_classes=48),
        'id': tf.int32,
        'mask': Image(shape=(None, None, 1), dtype=tf.uint8),
        'pathology': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'id': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 1), dtype=tf.uint8),
    'patient': Text(shape=(), dtype=tf.string),
    'view': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
})

VISUALIZATION

क्यूरेटेड_ब्रेस्ट_इमेजिंग_डीडीएसएम/मूल-द्रव्यमान

  • कॉन्फ़िग विवरण: दोषरहित पीएनजी में संकुचित जन मामलों की मूल छवियों।

  • डाउनलोड का आकार: 966.57 KiB

  • डेटासेट का आकार: 4.80 GiB

  • विभाजन:

विभाजित करना उदाहरण
'test' 348
'train' 1,166
  • विशेषताएं:
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
        'id': tf.int32,
        'mask': Image(shape=(None, None, 1), dtype=tf.uint8),
        'mass_margins': ClassLabel(shape=(), dtype=tf.int64, num_classes=20),
        'mass_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=21),
        'pathology': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'id': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 1), dtype=tf.uint8),
    'patient': Text(shape=(), dtype=tf.string),
    'view': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
})

VISUALIZATION