curated_breast_imaging_ddsm,curated_breast_imaging_ddsm

CBIS-DDSM (кураторское подмножество DDSM для визуализации груди) — это обновленная и стандартизированная версия цифровой базы данных для скрининговой маммографии (DDSM). DDSM представляет собой базу данных 2620 отсканированных маммографических исследований. Он содержит нормальные, доброкачественные и злокачественные случаи с подтвержденной информацией о патологии.

Конфигурация по умолчанию состоит из патчей, извлеченных из исходных маммограмм, в соответствии с описанием из ( http://arxiv.org/abs/1708.09427 ), чтобы сформулировать задачу для решения в традиционной настройке классификации изображений.

Поскольку для загрузки и чтения изображений, содержащихся в наборе данных, требуется специальное программное обеспечение и библиотеки, TFDS предполагает, что пользователь загрузил исходные файлы DCIM и преобразовал их в PNG.

Следующие команды (или эквивалентные) следует использовать для создания файлов PNG, чтобы гарантировать воспроизводимые результаты:

find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'

Полученные изображения следует поместить в manual_dir , например: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png .

@misc{CBIS_DDSM_Citation,
  doi = {10.7937/k9/tcia.2016.7o02s9cy},
  url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
  author = {Sawyer-Lee,  Rebecca and Gimenez,  Francisco and Hoogi,  Assaf and Rubin,  Daniel},
  title = {Curated Breast Imaging Subset of DDSM},
  publisher = {The Cancer Imaging Archive},
  year = {2016},
}
@article{TCIA_Citation,
  author = {
    K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
    P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
    L. Tarbox and F. Prior
  },
  title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
  Public Information Repository} },
  journal = {Journal of Digital Imaging},
  volume = {26},
  month = {December},
  year = {2013},
  pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
  author    = {Li Shen},
  title     = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
               An All Convolutional Design},
  journal   = {CoRR},
  volume    = {abs/1708.09427},
  year      = {2017},
  url       = {http://arxiv.org/abs/1708.09427},
  archivePrefix = {arXiv},
  eprint    = {1708.09427},
  timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

curated_breast_imaging_ddsm/patches (конфигурация по умолчанию)

  • Описание конфигурации : патчи, содержащие как кальцификацию, так и объемные образования, а также пути без аномалий. Оформлен как традиционная задача классификации 5 классов.

  • Размер загрузки : 2.01 MiB

  • Размер набора данных : 801.46 MiB

  • Сплиты :

Расколоть Примеры
'test' 9770
'train' 49 780
'validation' 5580
  • Структура функции :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
  • Документация по функциям :
Особенность Сорт Форма Dтип Описание
ОсобенностиDict
идентификатор Текст нить
изображение Изображение (Нет, Нет, 1) uint8
этикетка Метка класса int64

Визуализация

curated_breast_imaging_ddsm/original-calc

  • Описание конфига : Оригинальные изображения случаев кальцификации, сжатые в формате PNG без потерь.

  • Размер загрузки : 1.06 MiB

  • Размер набора данных : 4.42 GiB

  • Сплиты :

Расколоть Примеры
'test' 284
'train' 1227
  • Структура функции :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
        'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Документация по функциям :
Особенность Сорт Форма Dтип Описание
ОсобенностиDict
аномалии Последовательность
аномалии/оценка Метка класса int64
аномалии/calc_distribution Метка класса int64
аномалии/calc_type Метка класса int64
аномалии/идентификатор Тензор int32
аномалии/маска Изображение (Нет, Нет, 1) uint8
аномалии/патология Метка класса int64
аномалии/тонкость Метка класса int64
грудь Метка класса int64
идентификатор Текст нить
изображение Изображение (Нет, Нет, 1) uint8
пациент Текст нить
вид Метка класса int64

Визуализация

curated_breast_imaging_ddsm/оригинальная масса

  • Описание конфига : Оригинальные изображения массовых корпусов, сжатые в PNG без потерь.

  • Размер загрузки : 966.57 KiB

  • Размер набора данных : 4.80 GiB

  • Сплиты :

Расколоть Примеры
'test' 348
'train' 1166
  • Структура функции :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
        'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Документация по функциям :
Особенность Сорт Форма Dтип Описание
ОсобенностиDict
аномалии Последовательность
аномалии/оценка Метка класса int64
аномалии/идентификатор Тензор int32
аномалии/маска Изображение (Нет, Нет, 1) uint8
аномалии/mass_margins Метка класса int64
аномалии/mass_shape Метка класса int64
аномалии/патология Метка класса int64
аномалии/тонкость Метка класса int64
грудь Метка класса int64
идентификатор Текст нить
изображение Изображение (Нет, Нет, 1) uint8
пациент Текст нить
вид Метка класса int64

Визуализация