curated_breast_imaging_ddsm, curated_breast_imaging_ddsm

CBIS-DDSM (Tập hợp hình ảnh vú được tuyển chọn của DDSM) là phiên bản cập nhật và chuẩn hóa của Cơ sở dữ liệu kỹ thuật số để chụp nhũ ảnh sàng lọc (DDSM). DDSM là một cơ sở dữ liệu gồm 2.620 nghiên cứu về phim chụp nhũ ảnh được quét. Nó chứa các trường hợp bình thường, lành tính và ác tính với thông tin bệnh lý đã được xác minh.

Cấu hình mặc định được tạo từ các bản vá trích xuất từ ​​ảnh chụp quang tuyến vú ban đầu, theo mô tả từ ( http://arxiv.org/abs/1708.09427 ), nhằm tạo khung cho nhiệm vụ cần giải quyết trong cài đặt phân loại hình ảnh truyền thống.

Vì cần có phần mềm và thư viện đặc biệt để tải xuống và đọc các hình ảnh có trong tập dữ liệu, TFDS giả định rằng người dùng đã tải xuống các tệp DCIM gốc và chuyển đổi chúng thành PNG.

Các lệnh sau (hoặc tương đương) nên được sử dụng để tạo các tệp PNG, nhằm đảm bảo kết quả có thể lặp lại:

find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'

Hình ảnh thu được phải được đặt trong manual_dir , như: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png .

  • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

  • Các khóa được giám sát (Xem as_supervised doc ): None

  • trích dẫn :

@misc{CBIS_DDSM_Citation,
  doi = {10.7937/k9/tcia.2016.7o02s9cy},
  url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
  author = {Sawyer-Lee,  Rebecca and Gimenez,  Francisco and Hoogi,  Assaf and Rubin,  Daniel},
  title = {Curated Breast Imaging Subset of DDSM},
  publisher = {The Cancer Imaging Archive},
  year = {2016},
}
@article{TCIA_Citation,
  author = {
    K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
    P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
    L. Tarbox and F. Prior
  },
  title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
  Public Information Repository} },
  journal = {Journal of Digital Imaging},
  volume = {26},
  month = {December},
  year = {2013},
  pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
  author    = {Li Shen},
  title     = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
               An All Convolutional Design},
  journal   = {CoRR},
  volume    = {abs/1708.09427},
  year      = {2017},
  url       = {http://arxiv.org/abs/1708.09427},
  archivePrefix = {arXiv},
  eprint    = {1708.09427},
  timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

curated_breast_imaging_ddsm/patches (cấu hình mặc định)

  • Mô tả cấu hình : Các bản vá chứa cả trường hợp vôi hóa và khối, cộng với các đường dẫn không có bất thường. Được thiết kế như một nhiệm vụ phân loại 5 lớp truyền thống.

  • Kích thước tải xuống : 2.01 MiB

  • Kích thước tập dữ liệu : 801.46 MiB

  • Chia tách :

Tách ra ví dụ
'test' 9.770
'train' 49,780
'validation' 5,580
  • Cấu trúc tính năng :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
  • Tài liệu tính năng :
Tính năng Lớp học Hình dạng Dtype Sự miêu tả
Tính năngDict
nhận dạng Chữ sợi dây
hình ảnh Hình ảnh (Không có, Không có, 1) uint8
nhãn LớpNhãn int64

Hình dung

curated_breast_imaging_ddsm/ original-calc

  • Mô tả cấu hình : Hình ảnh gốc của các trường hợp vôi hóa được nén ở định dạng PNG không mất dữ liệu.

  • Kích thước tải xuống : 1.06 MiB

  • Kích thước tập dữ liệu : 4.42 GiB

  • Chia tách :

Tách ra ví dụ
'test' 284
'train' 1.227
  • Cấu trúc tính năng :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
        'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Tài liệu tính năng :
Tính năng Lớp học Hình dạng Dtype Sự miêu tả
Tính năngDict
bất thường Sự liên tiếp
bất thường/đánh giá LớpNhãn int64
bất thường/calc_distribution LớpNhãn int64
bất thường/calc_type LớpNhãn int64
bất thường/id tenxơ int32
bất thường/mặt nạ Hình ảnh (Không có, Không có, 1) uint8
bất thường/bệnh lý LớpNhãn int64
bất thường/tinh tế LớpNhãn int64
nhũ hoa LớpNhãn int64
nhận dạng Chữ sợi dây
hình ảnh Hình ảnh (Không có, Không có, 1) uint8
kiên nhẫn Chữ sợi dây
xem LớpNhãn int64

Hình dung

curated_breast_imaging_ddsm/khối lượng gốc

  • Mô tả cấu hình : Hình ảnh gốc của các trường hợp hàng loạt được nén ở định dạng PNG không mất dữ liệu.

  • Kích thước tải xuống : 966.57 KiB

  • Kích thước tập dữ liệu : 4.80 GiB

  • Chia tách :

Tách ra ví dụ
'test' 348
'train' 1.166
  • Cấu trúc tính năng :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
        'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Tài liệu tính năng :
Tính năng Lớp học Hình dạng Dtype Sự miêu tả
Tính năngDict
bất thường Sự liên tiếp
bất thường/đánh giá LớpNhãn int64
bất thường/id tenxơ int32
bất thường/mặt nạ Hình ảnh (Không có, Không có, 1) uint8
bất thường/mass_margins LớpNhãn int64
bất thường/mass_shape LớpNhãn int64
bất thường/bệnh lý LớpNhãn int64
bất thường/tinh tế LớpNhãn int64
nhũ hoa LớpNhãn int64
nhận dạng Chữ sợi dây
hình ảnh Hình ảnh (Không có, Không có, 1) uint8
kiên nhẫn Chữ sợi dây
xem LớpNhãn int64

Hình dung