Visualisasi : Jelajahi di Kenali Data Anda
Deskripsi :
CBIS-DDSM (Curated Breast Imaging Subset of DDSM) adalah versi terbaru dan standar dari Digital Database for Screening Mammography (DDSM). DDSM adalah database dari 2.620 studi mamografi film yang dipindai. Ini berisi kasus normal, jinak, dan ganas dengan informasi patologi yang terverifikasi.
Konfigurasi default dibuat dari tambalan yang diekstraksi dari mammogram asli, mengikuti deskripsi dari ( http://arxiv.org/abs/1708.09427 ), untuk membingkai tugas yang harus diselesaikan dalam pengaturan klasifikasi gambar tradisional.
Beranda : https://wiki.cancerimagingarchive.net/display/Public/CBIS-DDSM
Kode sumber :
tfds.image_classification.CuratedBreastImagingDDSM
Versi :
-
2.0.1
: API split baru ( https://tensorflow.org/datasets/splits ) -
3.0.0
(default): Pengambilan sampel pemangkasan yang lebih baik ( https://github.com/tensorflow/datasets/pull/2502 )
-
Instruksi pengunduhan manual : Kumpulan data ini mengharuskan Anda mengunduh data sumber secara manual ke
download_config.manual_dir
(default ke~/tensorflow_datasets/downloads/manual/
):
Anda dapat mengunduh gambar dari https://wiki.cancerimagingarchive.net/display/Public/CBIS-DDSM
Karena perangkat lunak dan pustaka khusus diperlukan untuk mengunduh dan membaca gambar yang terdapat dalam kumpulan data, TFDS mengasumsikan bahwa pengguna telah mengunduh file DCIM asli dan mengonversinya ke PNG.
Perintah berikut (atau yang setara) harus digunakan untuk menghasilkan file PNG, untuk menjamin hasil yang dapat direproduksi:
find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'
Gambar yang dihasilkan harus diletakkan manual_dir
, seperti: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png
.
Di-cache otomatis ( dokumentasi ): Tidak
Kunci yang diawasi (Lihat
as_supervised
doc ):None
Kutipan :
@misc{CBIS_DDSM_Citation,
doi = {10.7937/k9/tcia.2016.7o02s9cy},
url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
author = {Sawyer-Lee, Rebecca and Gimenez, Francisco and Hoogi, Assaf and Rubin, Daniel},
title = {Curated Breast Imaging Subset of DDSM},
publisher = {The Cancer Imaging Archive},
year = {2016},
}
@article{TCIA_Citation,
author = {
K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
L. Tarbox and F. Prior
},
title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
Public Information Repository} },
journal = {Journal of Digital Imaging},
volume = {26},
month = {December},
year = {2013},
pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
author = {Li Shen},
title = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
An All Convolutional Design},
journal = {CoRR},
volume = {abs/1708.09427},
year = {2017},
url = {http://arxiv.org/abs/1708.09427},
archivePrefix = {arXiv},
eprint = {1708.09427},
timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
biburl = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
bibsource = {dblp computer science bibliography, https://dblp.org}
}
curated_breast_imaging_ddsm/patches (konfigurasi default)
Deskripsi konfigurasi : Tambalan yang berisi kasus kalsifikasi dan massa, ditambah jalur tanpa kelainan. Dirancang sebagai tugas klasifikasi 5 kelas tradisional.
Ukuran unduhan :
2.01 MiB
Ukuran dataset :
801.46 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 9.770 |
'train' | 49.780 |
'validation' | 5.580 |
- Struktur fitur :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
pengenal | Teks | rangkaian | ||
gambar | Gambar | (Tidak ada, Tidak ada, 1) | uint8 | |
label | LabelKelas | int64 |
- Gambar ( tfds.show_examples ):
- Contoh ( tfds.as_dataframe ):
curated_breast_imaging_ddsm/original-calc
Deskripsi konfigurasi : Gambar asli dari kasus kalsifikasi dikompresi dalam PNG lossless.
Ukuran unduhan :
1.06 MiB
Ukuran dataset :
4.42 GiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 284 |
'train' | 1.227 |
- Struktur fitur :
FeaturesDict({
'abnormalities': Sequence({
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
'id': int32,
'mask': Image(shape=(None, None, 1), dtype=uint8),
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'patient': Text(shape=(), dtype=string),
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
kelainan | Urutan | |||
kelainan/penilaian | LabelKelas | int64 | ||
abnormalitas/distribusi_kalk | LabelKelas | int64 | ||
abnormalitas/tipe_kalk | LabelKelas | int64 | ||
kelainan/id | Tensor | int32 | ||
kelainan/topeng | Gambar | (Tidak ada, Tidak ada, 1) | uint8 | |
kelainan/patologi | LabelKelas | int64 | ||
kelainan/halus | LabelKelas | int64 | ||
dada | LabelKelas | int64 | ||
pengenal | Teks | rangkaian | ||
gambar | Gambar | (Tidak ada, Tidak ada, 1) | uint8 | |
sabar | Teks | rangkaian | ||
melihat | LabelKelas | int64 |
- Gambar ( tfds.show_examples ):
- Contoh ( tfds.as_dataframe ):
curated_breast_imaging_ddsm/original-mass
Deskripsi konfigurasi : Gambar asli dari kasing massal dikompresi dalam PNG lossless.
Ukuran unduhan :
966.57 KiB
Ukuran dataset :
4.80 GiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 348 |
'train' | 1.166 |
- Struktur fitur :
FeaturesDict({
'abnormalities': Sequence({
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
'id': int32,
'mask': Image(shape=(None, None, 1), dtype=uint8),
'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'patient': Text(shape=(), dtype=string),
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
kelainan | Urutan | |||
kelainan/penilaian | LabelKelas | int64 | ||
kelainan/id | Tensor | int32 | ||
kelainan/topeng | Gambar | (Tidak ada, Tidak ada, 1) | uint8 | |
abnormalitas/margin_massa | LabelKelas | int64 | ||
kelainan/bentuk_massa | LabelKelas | int64 | ||
kelainan/patologi | LabelKelas | int64 | ||
kelainan/halus | LabelKelas | int64 | ||
dada | LabelKelas | int64 | ||
pengenal | Teks | rangkaian | ||
gambar | Gambar | (Tidak ada, Tidak ada, 1) | uint8 | |
sabar | Teks | rangkaian | ||
melihat | LabelKelas | int64 |
- Gambar ( tfds.show_examples ):
- Contoh ( tfds.as_dataframe ):