Google I/O — это обертка! Наверстать упущенное в сеансах TensorFlow Просмотреть сеансы

curated_breast_imaging_ddsm

CBIS-DDSM (Curated Imaging Subset of DDSM) - это обновленная и стандартизированная версия цифровой базы данных для скрининговой маммографии (DDSM). DDSM - это база данных, содержащая 2620 сканированных маммографических исследований. Он содержит нормальные, доброкачественные и злокачественные случаи с подтвержденной информацией о патологии.

Конфигурации по умолчанию состоит из патчей , извлеченных из исходной маммографии, следуя описанию из http://arxiv.org/abs/1708.09427, для того , чтобы обрамляет задачу решить в традиционной обстановке классификации изображения.

Поскольку для загрузки и чтения изображений, содержащихся в наборе данных, необходимы специальное программное обеспечение и библиотеки, TFDS предполагает, что пользователь загрузил исходные файлы DCIM и преобразовал их в PNG.

Следующие команды (или их эквиваленты) следует использовать для создания файлов PNG, чтобы гарантировать воспроизводимые результаты:

find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'

Полученные изображения должны быть помещены в manual_dir , как: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png .

@misc{CBIS_DDSM_Citation,
  doi = {10.7937/k9/tcia.2016.7o02s9cy},
  url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
  author = {Sawyer-Lee,  Rebecca and Gimenez,  Francisco and Hoogi,  Assaf and Rubin,  Daniel},
  title = {Curated Breast Imaging Subset of DDSM},
  publisher = {The Cancer Imaging Archive},
  year = {2016},
}
@article{TCIA_Citation,
  author = {
    K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
    P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
    L. Tarbox and F. Prior
  },
  title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
  Public Information Repository} },
  journal = {Journal of Digital Imaging},
  volume = {26},
  month = {December},
  year = {2013},
  pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
  author    = {Li Shen},
  title     = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
               An All Convolutional Design},
  journal   = {CoRR},
  volume    = {abs/1708.09427},
  year      = {2017},
  url       = {http://arxiv.org/abs/1708.09427},
  archivePrefix = {arXiv},
  eprint    = {1708.09427},
  timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

curated_breast_imaging_ddsm / patches (конфигурация по умолчанию)

  • Описание конфигурации: Участки , содержащие как calsification и массовые случаи, плюс pathces без каких - либо отклонений. Разработан как традиционная 5-классная классификационная задача.

  • Скачать Размер: 2.01 MiB

  • Dataset Размер: 801.46 MiB

  • расколы:

Расколоть Примеры
'test' 9 770
'train' 49 780
'validation' 5 580
  • Особенности:
FeaturesDict({
    'id': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 1), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
})

Визуализация

curated_breast_imaging_ddsm / original-calc

  • Описание Config: Оригинальные образы случаев кальцификации сжатых без потерь PNG.

  • Скачать Размер: 1.06 MiB

  • Dataset Размер: 4.42 GiB

  • расколы:

Расколоть Примеры
'test' 284
'train' 1,227
  • Особенности:
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
        'calc_distribution': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
        'calc_type': ClassLabel(shape=(), dtype=tf.int64, num_classes=48),
        'id': tf.int32,
        'mask': Image(shape=(None, None, 1), dtype=tf.uint8),
        'pathology': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'id': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 1), dtype=tf.uint8),
    'patient': Text(shape=(), dtype=tf.string),
    'view': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
})

Визуализация

curated_breast_imaging_ddsm / оригинальная масса

  • Описание Config: Оригинальные образы случаев массовых сжатых без потерь PNG.

  • Скачать Размер: 966.57 KiB

  • Dataset Размер: 4.80 GiB

  • расколы:

Расколоть Примеры
'test' 348
'train' 1,166
  • Особенности:
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
        'id': tf.int32,
        'mask': Image(shape=(None, None, 1), dtype=tf.uint8),
        'mass_margins': ClassLabel(shape=(), dtype=tf.int64, num_classes=20),
        'mass_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=21),
        'pathology': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'id': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 1), dtype=tf.uint8),
    'patient': Text(shape=(), dtype=tf.string),
    'view': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
})

Визуализация