การ สร้างภาพ : สำรวจใน Know Your Data
คำอธิบาย :
CBIS-DDSM (Curated Breast Imaging Subset of DDSM) เป็นฐานข้อมูลดิจิทัลสำหรับการตรวจคัดกรองเต้านม (DDSM) รุ่นปรับปรุงและเป็นมาตรฐาน DDSM เป็นฐานข้อมูลของการศึกษาเอกซเรย์เต้านมด้วยฟิล์มสแกน 2,620 ชิ้น ประกอบด้วยกรณีปกติ อ่อนโยน และร้ายกาจพร้อมข้อมูลทางพยาธิวิทยาที่ผ่านการตรวจสอบแล้ว
การกำหนดค่าเริ่มต้นทำจากแพตช์ที่ดึงมาจากแมมโมแกรมต้นฉบับ ตามคำอธิบายจาก http://arxiv.org/abs/1708.09427 เพื่อวางกรอบงานที่ต้องแก้ไขในการตั้งค่าการจัดประเภทภาพแบบดั้งเดิม
หน้าแรก : https://wiki.cancerimagingarchive.net/display/Public/CBIS-DDSM
รหัสที่มา :
tfds.image_classification.CuratedBreastImagingDDSM
รุ่น :
-
2.0.1
: API แยกใหม่ ( https://tensorflow.org/datasets/splits ) -
3.0.0
(ค่าเริ่มต้น): การสุ่มตัวอย่างการครอบตัดที่ดีขึ้น ( https://github.com/tensorflow/datasets/pull/2502 )
-
คำแนะนำในการดาวน์โหลดด้วยตนเอง : ชุดข้อมูลนี้กำหนดให้คุณต้องดาวน์โหลดแหล่งข้อมูลด้วยตนเองลงใน
download_config.manual_dir
(ค่าเริ่มต้นเป็น~/tensorflow_datasets/downloads/manual/
):
คุณสามารถดาวน์โหลดรูปภาพได้จาก https://wiki.cancerimagingarchive.net/display/Public/CBIS-DDSM
เนื่องจากจำเป็นต้องใช้ซอฟต์แวร์และไลบรารีพิเศษในการดาวน์โหลดและอ่านรูปภาพที่มีอยู่ในชุดข้อมูล TFDS จะถือว่าผู้ใช้ดาวน์โหลดไฟล์ DCIM ต้นฉบับและแปลงเป็น PNG
ควรใช้คำสั่งต่อไปนี้ (หรือเทียบเท่า) เพื่อสร้างไฟล์ PNG เพื่อรับประกันผลลัพธ์ที่ทำซ้ำได้:
find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'
รูปภาพผลลัพธ์ควรใส่ใน manual_dir
เช่น: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png
แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):None
การอ้างอิง :
@misc{CBIS_DDSM_Citation,
doi = {10.7937/k9/tcia.2016.7o02s9cy},
url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
author = {Sawyer-Lee, Rebecca and Gimenez, Francisco and Hoogi, Assaf and Rubin, Daniel},
title = {Curated Breast Imaging Subset of DDSM},
publisher = {The Cancer Imaging Archive},
year = {2016},
}
@article{TCIA_Citation,
author = {
K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
L. Tarbox and F. Prior
},
title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
Public Information Repository} },
journal = {Journal of Digital Imaging},
volume = {26},
month = {December},
year = {2013},
pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
author = {Li Shen},
title = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
An All Convolutional Design},
journal = {CoRR},
volume = {abs/1708.09427},
year = {2017},
url = {http://arxiv.org/abs/1708.09427},
archivePrefix = {arXiv},
eprint = {1708.09427},
timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
biburl = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
bibsource = {dblp computer science bibliography, https://dblp.org}
}
curated_breast_imaging_ddsm/patches (การกำหนดค่าเริ่มต้น)
คำอธิบาย การกำหนดค่า : แพตช์ที่มีทั้งแคลซิฟิเคชันและมวลรวม รวมถึงพาธซีที่ไม่มีความผิดปกติ ออกแบบเป็นงานจำแนกประเภท 5 ชั้นแบบดั้งเดิม
ขนาดการดาวน์โหลด :
2.01 MiB
ขนาดชุดข้อมูล :
801.46 MiB
แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 9,770 |
'train' | 49,780 |
'validation' | 5,580 |
- โครงสร้างคุณลักษณะ :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
รหัส | ข้อความ | สตริง | ||
ภาพ | ภาพ | (ไม่มี, ไม่มี, 1) | uint8 | |
ฉลาก | ป้ายกำกับคลาส | int64 |
- รูป ( tfds.show_examples ):
- ตัวอย่าง ( tfds.as_dataframe ):
curated_breast_imaging_ddsm/original-calc
คำอธิบาย การกำหนดค่า: ภาพต้นฉบับของกรณีการกลายเป็นปูนที่ถูกบีบอัดใน PNG แบบไม่สูญเสียข้อมูล
ขนาดการดาวน์โหลด :
1.06 MiB
ขนาดชุดข้อมูล :
4.42 GiB
แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 284 |
'train' | 1,227 |
- โครงสร้างคุณลักษณะ :
FeaturesDict({
'abnormalities': Sequence({
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
'id': int32,
'mask': Image(shape=(None, None, 1), dtype=uint8),
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'patient': Text(shape=(), dtype=string),
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
ความผิดปกติ | ลำดับ | |||
ความผิดปกติ/การประเมิน | ป้ายกำกับคลาส | int64 | ||
ความผิดปกติ/calc_distribution | ป้ายกำกับคลาส | int64 | ||
ความผิดปกติ/calc_type | ป้ายกำกับคลาส | int64 | ||
ความผิดปกติ/id | เทนเซอร์ | int32 | ||
ความผิดปกติ/หน้ากาก | ภาพ | (ไม่มี, ไม่มี, 1) | uint8 | |
ความผิดปกติ/พยาธิสภาพ | ป้ายกำกับคลาส | int64 | ||
ความผิดปกติ/ความละเอียดอ่อน | ป้ายกำกับคลาส | int64 | ||
หน้าอก | ป้ายกำกับคลาส | int64 | ||
รหัส | ข้อความ | สตริง | ||
ภาพ | ภาพ | (ไม่มี, ไม่มี, 1) | uint8 | |
อดทน | ข้อความ | สตริง | ||
ดู | ป้ายกำกับคลาส | int64 |
- รูป ( tfds.show_examples ):
- ตัวอย่าง ( tfds.as_dataframe ):
curated_breast_imaging_ddsm/original-mass
คำอธิบาย การกำหนดค่า: ภาพต้นฉบับของกรณีจำนวนมากที่บีบอัดใน PNG แบบไม่สูญเสียข้อมูล
ขนาดการดาวน์โหลด :
966.57 KiB
ขนาดชุดข้อมูล :
4.80 GiB
แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 348 |
'train' | 1,166 |
- โครงสร้างคุณลักษณะ :
FeaturesDict({
'abnormalities': Sequence({
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
'id': int32,
'mask': Image(shape=(None, None, 1), dtype=uint8),
'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'patient': Text(shape=(), dtype=string),
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
ความผิดปกติ | ลำดับ | |||
ความผิดปกติ/การประเมิน | ป้ายกำกับคลาส | int64 | ||
ความผิดปกติ/id | เทนเซอร์ | int32 | ||
ความผิดปกติ/หน้ากาก | ภาพ | (ไม่มี, ไม่มี, 1) | uint8 | |
ความผิดปกติ/mass_margins | ป้ายกำกับคลาส | int64 | ||
ความผิดปกติ/mass_shape | ป้ายกำกับคลาส | int64 | ||
ความผิดปกติ/พยาธิสภาพ | ป้ายกำกับคลาส | int64 | ||
ความผิดปกติ/ความละเอียดอ่อน | ป้ายกำกับคลาส | int64 | ||
หน้าอก | ป้ายกำกับคลาส | int64 | ||
รหัส | ข้อความ | สตริง | ||
ภาพ | ภาพ | (ไม่มี, ไม่มี, 1) | uint8 | |
อดทน | ข้อความ | สตริง | ||
ดู | ป้ายกำกับคลาส | int64 |
- รูป ( tfds.show_examples ):
- ตัวอย่าง ( tfds.as_dataframe ):