Визуализация : Исследуйте в Know Your Data
Описание :
CBIS-DDSM (кураторское подмножество DDSM для визуализации груди) — это обновленная и стандартизированная версия цифровой базы данных для скрининговой маммографии (DDSM). DDSM представляет собой базу данных 2620 отсканированных маммографических исследований. Он содержит нормальные, доброкачественные и злокачественные случаи с подтвержденной информацией о патологии.
Конфигурация по умолчанию состоит из патчей, извлеченных из исходных маммограмм, в соответствии с описанием из http://arxiv.org/abs/1708.09427, чтобы сформулировать задачу для решения в традиционной настройке классификации изображений.
Домашняя страница : https://wiki.cancerimagingarchive.net/display/Public/CBIS-DDSM
Исходный код :
tfds.image_classification.CuratedBreastImagingDDSM
Версии :
-
2.0.1
: новый сплит API ( https://tensorflow.org/datasets/splits ) -
3.0.0
(по умолчанию): улучшенная выборка обрезки ( https://github.com/tensorflow/datasets/pull/2502 )
-
Инструкции по ручной загрузке : этот набор данных требует, чтобы вы загружали исходные данные вручную в
download_config.manual_dir
(по умолчанию~/tensorflow_datasets/downloads/manual/
):
Вы можете загрузить изображения с https://wiki.cancerimagingarchive.net/display/Public/CBIS-DDSM .
Поскольку для загрузки и чтения изображений, содержащихся в наборе данных, требуется специальное программное обеспечение и библиотеки, TFDS предполагает, что пользователь загрузил исходные файлы DCIM и преобразовал их в PNG.
Следующие команды (или эквивалентные) следует использовать для создания файлов PNG, чтобы гарантировать воспроизводимые результаты:
find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'
Полученные изображения следует поместить в manual_dir
, например: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png
.
Автоматическое кэширование ( документация ): Нет
Ключи под наблюдением (см . документ
as_supervised
):None
Цитата :
@misc{CBIS_DDSM_Citation,
doi = {10.7937/k9/tcia.2016.7o02s9cy},
url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
author = {Sawyer-Lee, Rebecca and Gimenez, Francisco and Hoogi, Assaf and Rubin, Daniel},
title = {Curated Breast Imaging Subset of DDSM},
publisher = {The Cancer Imaging Archive},
year = {2016},
}
@article{TCIA_Citation,
author = {
K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
L. Tarbox and F. Prior
},
title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
Public Information Repository} },
journal = {Journal of Digital Imaging},
volume = {26},
month = {December},
year = {2013},
pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
author = {Li Shen},
title = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
An All Convolutional Design},
journal = {CoRR},
volume = {abs/1708.09427},
year = {2017},
url = {http://arxiv.org/abs/1708.09427},
archivePrefix = {arXiv},
eprint = {1708.09427},
timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
biburl = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
bibsource = {dblp computer science bibliography, https://dblp.org}
}
curated_breast_imaging_ddsm/patches (конфигурация по умолчанию)
Описание конфигурации : патчи, содержащие как кальцификацию, так и объемные образования, а также пути без аномалий. Оформлен как традиционная задача классификации 5 классов.
Размер загрузки :
2.01 MiB
Размер набора данных :
801.46 MiB
.Сплиты :
Расколоть | Примеры |
---|---|
'test' | 9770 |
'train' | 49 780 |
'validation' | 5580 |
- Структура функции :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
я бы | Текст | нить | ||
изображение | Изображение | (Нет, Нет, 1) | uint8 | |
этикетка | Метка класса | int64 |
- Рисунок ( tfds.show_examples ):
- Примеры ( tfds.as_dataframe ):
curated_breast_imaging_ddsm/original-calc
Описание конфига : Оригинальные изображения случаев кальцификации, сжатые в формате PNG без потерь.
Размер загрузки :
1.06 MiB
Размер набора данных :
4.42 GiB
Сплиты :
Расколоть | Примеры |
---|---|
'test' | 284 |
'train' | 1227 |
- Структура функции :
FeaturesDict({
'abnormalities': Sequence({
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
'id': int32,
'mask': Image(shape=(None, None, 1), dtype=uint8),
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'patient': Text(shape=(), dtype=string),
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
аномалии | Последовательность | |||
аномалии/оценка | Метка класса | int64 | ||
аномалии/calc_distribution | Метка класса | int64 | ||
аномалии/calc_type | Метка класса | int64 | ||
аномалии/идентификатор | Тензор | int32 | ||
аномалии/маска | Изображение | (Нет, Нет, 1) | uint8 | |
аномалии/патология | Метка класса | int64 | ||
аномалии/тонкость | Метка класса | int64 | ||
грудь | Метка класса | int64 | ||
я бы | Текст | нить | ||
изображение | Изображение | (Нет, Нет, 1) | uint8 | |
пациент | Текст | нить | ||
Посмотреть | Метка класса | int64 |
- Рисунок ( tfds.show_examples ):
- Примеры ( tfds.as_dataframe ):
curated_breast_imaging_ddsm/оригинальная масса
Описание конфига : Оригинальные изображения массовых корпусов, сжатые в PNG без потерь.
Размер загрузки :
966.57 KiB
Размер набора данных :
4.80 GiB
Сплиты :
Расколоть | Примеры |
---|---|
'test' | 348 |
'train' | 1166 |
- Структура функции :
FeaturesDict({
'abnormalities': Sequence({
'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
'id': int32,
'mask': Image(shape=(None, None, 1), dtype=uint8),
'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 1), dtype=uint8),
'patient': Text(shape=(), dtype=string),
'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
аномалии | Последовательность | |||
аномалии/оценка | Метка класса | int64 | ||
аномалии/идентификатор | Тензор | int32 | ||
аномалии/маска | Изображение | (Нет, Нет, 1) | uint8 | |
аномалии/mass_margins | Метка класса | int64 | ||
аномалии/mass_shape | Метка класса | int64 | ||
аномалии/патология | Метка класса | int64 | ||
аномалии/тонкость | Метка класса | int64 | ||
грудь | Метка класса | int64 | ||
я бы | Текст | нить | ||
изображение | Изображение | (Нет, Нет, 1) | uint8 | |
пациент | Текст | нить | ||
Посмотреть | Метка класса | int64 |
- Рисунок ( tfds.show_examples ):
- Примеры ( tfds.as_dataframe ):