curated_breast_imaging_ddsm,curated_breast_imaging_ddsm

CBIS-DDSM (Curated Breast Imaging Subset of DDSM) adalah versi terbaru dan standar dari Digital Database for Screening Mammography (DDSM). DDSM adalah database dari 2.620 studi mamografi film yang dipindai. Ini berisi kasus normal, jinak, dan ganas dengan informasi patologi yang terverifikasi.

Konfigurasi default dibuat dari tambalan yang diekstraksi dari mammogram asli, mengikuti deskripsi dari ( http://arxiv.org/abs/1708.09427 ), untuk membingkai tugas yang harus diselesaikan dalam pengaturan klasifikasi gambar tradisional.

Karena perangkat lunak dan pustaka khusus diperlukan untuk mengunduh dan membaca gambar yang terdapat dalam kumpulan data, TFDS mengasumsikan bahwa pengguna telah mengunduh file DCIM asli dan mengonversinya ke PNG.

Perintah berikut (atau yang setara) harus digunakan untuk menghasilkan file PNG, untuk menjamin hasil yang dapat direproduksi:

find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'

Gambar yang dihasilkan harus diletakkan manual_dir , seperti: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png .

@misc{CBIS_DDSM_Citation,
  doi = {10.7937/k9/tcia.2016.7o02s9cy},
  url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
  author = {Sawyer-Lee,  Rebecca and Gimenez,  Francisco and Hoogi,  Assaf and Rubin,  Daniel},
  title = {Curated Breast Imaging Subset of DDSM},
  publisher = {The Cancer Imaging Archive},
  year = {2016},
}
@article{TCIA_Citation,
  author = {
    K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
    P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
    L. Tarbox and F. Prior
  },
  title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
  Public Information Repository} },
  journal = {Journal of Digital Imaging},
  volume = {26},
  month = {December},
  year = {2013},
  pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
  author    = {Li Shen},
  title     = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
               An All Convolutional Design},
  journal   = {CoRR},
  volume    = {abs/1708.09427},
  year      = {2017},
  url       = {http://arxiv.org/abs/1708.09427},
  archivePrefix = {arXiv},
  eprint    = {1708.09427},
  timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

curated_breast_imaging_ddsm/patches (konfigurasi default)

  • Deskripsi konfigurasi : Tambalan yang berisi kasus kalsifikasi dan massa, ditambah jalur tanpa kelainan. Dirancang sebagai tugas klasifikasi 5 kelas tradisional.

  • Ukuran unduhan : 2.01 MiB

  • Ukuran dataset : 801.46 MiB

  • Perpecahan :

Membelah Contoh
'test' 9.770
'train' 49.780
'validation' 5.580
  • Struktur fitur :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
pengenal Teks rangkaian
gambar Gambar (Tidak ada, Tidak ada, 1) uint8
label LabelKelas int64

Visualisasi

curated_breast_imaging_ddsm/original-calc

  • Deskripsi konfigurasi : Gambar asli dari kasus kalsifikasi dikompresi dalam PNG lossless.

  • Ukuran unduhan : 1.06 MiB

  • Ukuran dataset : 4.42 GiB

  • Perpecahan :

Membelah Contoh
'test' 284
'train' 1.227
  • Struktur fitur :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
        'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
kelainan Urutan
kelainan/penilaian LabelKelas int64
abnormalitas/distribusi_kalk LabelKelas int64
abnormalitas/tipe_kalk LabelKelas int64
kelainan/id Tensor int32
kelainan/topeng Gambar (Tidak ada, Tidak ada, 1) uint8
kelainan/patologi LabelKelas int64
kelainan/halus LabelKelas int64
dada LabelKelas int64
pengenal Teks rangkaian
gambar Gambar (Tidak ada, Tidak ada, 1) uint8
sabar Teks rangkaian
melihat LabelKelas int64

Visualisasi

curated_breast_imaging_ddsm/original-mass

  • Deskripsi konfigurasi : Gambar asli dari kasing massal dikompresi dalam PNG lossless.

  • Ukuran unduhan : 966.57 KiB

  • Ukuran dataset : 4.80 GiB

  • Perpecahan :

Membelah Contoh
'test' 348
'train' 1.166
  • Struktur fitur :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
        'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
kelainan Urutan
kelainan/penilaian LabelKelas int64
kelainan/id Tensor int32
kelainan/topeng Gambar (Tidak ada, Tidak ada, 1) uint8
abnormalitas/margin_massa LabelKelas int64
kelainan/bentuk_massa LabelKelas int64
kelainan/patologi LabelKelas int64
kelainan/halus LabelKelas int64
dada LabelKelas int64
pengenal Teks rangkaian
gambar Gambar (Tidak ada, Tidak ada, 1) uint8
sabar Teks rangkaian
melihat LabelKelas int64

Visualisasi