ช่วยปกป้อง Great Barrier Reef กับ TensorFlow บน Kaggle เข้าร่วมท้าทาย

curated_breast_imaging_ddsm

CBIS-DDSM (Curated Breast Imaging Subset of DDSM) เป็นเวอร์ชันปรับปรุงและเป็นมาตรฐานของ Digital Database for Screening Mammography (DDSM) DDSM เป็นฐานข้อมูลของการศึกษาการตรวจเต้านมด้วยฟิล์มที่สแกนแล้ว 2,620 ชิ้น ประกอบด้วยกรณีปกติ ไม่ร้ายแรง และร้ายแรงพร้อมข้อมูลทางพยาธิวิทยาที่ตรวจสอบแล้ว

กำหนดค่าเริ่มต้นที่ทำจากสารสกัดจากแพทช์ mammograms เดิมต่อไปนี้คำอธิบายจาก http://arxiv.org/abs/1708.09427, เพื่อให้กรอบงานในการแก้ปัญหาในการตั้งค่าการจัดหมวดหมู่ภาพแบบดั้งเดิม

เนื่องจากจำเป็นต้องใช้ซอฟต์แวร์และไลบรารีพิเศษในการดาวน์โหลดและอ่านภาพที่มีอยู่ในชุดข้อมูล TFDS จึงถือว่าผู้ใช้ดาวน์โหลดไฟล์ DCIM ต้นฉบับและแปลงเป็น PNG

ควรใช้คำสั่งต่อไปนี้ (หรือเทียบเท่า) เพื่อสร้างไฟล์ PNG เพื่อรับประกันผลลัพธ์ที่ทำซ้ำได้:

find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'

ภาพที่ควรจะใส่ใน manual_dir เช่น: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png

@misc{CBIS_DDSM_Citation,
  doi = {10.7937/k9/tcia.2016.7o02s9cy},
  url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
  author = {Sawyer-Lee,  Rebecca and Gimenez,  Francisco and Hoogi,  Assaf and Rubin,  Daniel},
  title = {Curated Breast Imaging Subset of DDSM},
  publisher = {The Cancer Imaging Archive},
  year = {2016},
}
@article{TCIA_Citation,
  author = {
    K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
    P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
    L. Tarbox and F. Prior
  },
  title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
  Public Information Repository} },
  journal = {Journal of Digital Imaging},
  volume = {26},
  month = {December},
  year = {2013},
  pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
  author    = {Li Shen},
  title     = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
               An All Convolutional Design},
  journal   = {CoRR},
  volume    = {abs/1708.09427},
  year      = {2017},
  url       = {http://arxiv.org/abs/1708.09427},
  archivePrefix = {arXiv},
  eprint    = {1708.09427},
  timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

curated_breast_imaging_ddsm/patches (การกำหนดค่าเริ่มต้น)

  • คำอธิบาย Config: แพทช์ที่มีทั้ง calsification และมวลกรณีบวก pathces ไม่มีความผิดปกติ ออกแบบให้เป็นงานจำแนก 5 คลาสแบบดั้งเดิม

  • ขนาดการดาวน์โหลด: 2.01 MiB

  • ขนาดชุด: 801.46 MiB

  • แยก:

แยก ตัวอย่าง
'test' 9,770
'train' 49,780
'validation' 5,580
  • คุณสมบัติ:
FeaturesDict({
    'id': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 1), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
})

การสร้างภาพ

curated_breast_imaging_ddsm/original-calc

  • คำอธิบาย Config: ภาพต้นฉบับของกรณีกลายเป็นปูนบีบอัดใน PNG lossless

  • ขนาดการดาวน์โหลด: 1.06 MiB

  • ขนาดชุด: 4.42 GiB

  • แยก:

แยก ตัวอย่าง
'test' 284
'train' 1,227
  • คุณสมบัติ:
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
        'calc_distribution': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
        'calc_type': ClassLabel(shape=(), dtype=tf.int64, num_classes=48),
        'id': tf.int32,
        'mask': Image(shape=(None, None, 1), dtype=tf.uint8),
        'pathology': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'id': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 1), dtype=tf.uint8),
    'patient': Text(shape=(), dtype=tf.string),
    'view': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
})

การสร้างภาพ

curated_breast_imaging_ddsm/original-mass

  • คำอธิบาย Config: ภาพต้นฉบับของกรณีมวลบีบอัดใน PNG lossless

  • ขนาดการดาวน์โหลด: 966.57 KiB

  • ขนาดชุด: 4.80 GiB

  • แยก:

แยก ตัวอย่าง
'test' 348
'train' 1,166
  • คุณสมบัติ:
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
        'id': tf.int32,
        'mask': Image(shape=(None, None, 1), dtype=tf.uint8),
        'mass_margins': ClassLabel(shape=(), dtype=tf.int64, num_classes=20),
        'mass_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=21),
        'pathology': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'id': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 1), dtype=tf.uint8),
    'patient': Text(shape=(), dtype=tf.string),
    'view': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
})

การสร้างภาพ