Sintonize-se com as primeiras mulheres em ML Simpósio esta terça-feira 19 out às 9h PST Register now

curated_breast_imaging_ddsm

O CBIS-DDSM (Subconjunto de imagens de mama com curadoria do DDSM) é uma versão atualizada e padronizada do banco de dados digital para mamografia de triagem (DDSM). O DDSM é um banco de dados de 2.620 estudos de mamografia de filmes digitalizados. Ele contém casos normais, benignos e malignos com informações de patologia verificadas.

A configuração padrão é feita de remendos extraídos das mamografias originais, seguindo a descrição de http://arxiv.org/abs/1708.09427, a fim de enquadrar a tarefa de resolver em um ambiente de classificação imagem tradicional.

Como softwares e bibliotecas especiais são necessários para baixar e ler as imagens contidas no conjunto de dados, o TFDS assume que o usuário fez o download dos arquivos DCIM originais e os converteu em PNG.

Os seguintes comandos (ou equivalentes) devem ser usados ​​para gerar os arquivos PNG, a fim de garantir resultados reproduzíveis:

find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'

Imagens resultantes devem ser colocados em manual_dir , como: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png .

@misc{CBIS_DDSM_Citation,
  doi = {10.7937/k9/tcia.2016.7o02s9cy},
  url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
  author = {Sawyer-Lee,  Rebecca and Gimenez,  Francisco and Hoogi,  Assaf and Rubin,  Daniel},
  title = {Curated Breast Imaging Subset of DDSM},
  publisher = {The Cancer Imaging Archive},
  year = {2016},
}
@article{TCIA_Citation,
  author = {
    K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
    P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
    L. Tarbox and F. Prior
  },
  title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
  Public Information Repository} },
  journal = {Journal of Digital Imaging},
  volume = {26},
  month = {December},
  year = {2013},
  pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
  author    = {Li Shen},
  title     = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
               An All Convolutional Design},
  journal   = {CoRR},
  volume    = {abs/1708.09427},
  year      = {2017},
  url       = {http://arxiv.org/abs/1708.09427},
  archivePrefix = {arXiv},
  eprint    = {1708.09427},
  timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

curated_breast_imaging_ddsm / patches (configuração padrão)

  • Descrição de configuração: patches contendo tanto calsification e casos em massa, mais pathces sem anormalidades. Projetado como uma tarefa de classificação tradicional de 5 classes.

  • Tamanho do download: 2.01 MiB

  • Dataset size: 801.46 MiB

  • desdobramentos:

Dividir Exemplos
'test' 9.770
'train' 49.780
'validation' 5.580
  • Características:
FeaturesDict({
    'id': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 1), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
})

Visualização

curated_breast_imaging_ddsm / original-calc

  • A inscrição Config: Imagens originais dos casos de calcificação compactados em PNG sem perdas.

  • Tamanho do download: 1.06 MiB

  • Tamanho do conjunto de dados: 4.42 GiB

  • desdobramentos:

Dividir Exemplos
'test' 284
'train' 1.227
  • Características:
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
        'calc_distribution': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
        'calc_type': ClassLabel(shape=(), dtype=tf.int64, num_classes=48),
        'id': tf.int32,
        'mask': Image(shape=(None, None, 1), dtype=tf.uint8),
        'pathology': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'id': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 1), dtype=tf.uint8),
    'patient': Text(shape=(), dtype=tf.string),
    'view': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
})

Visualização

curated_breast_imaging_ddsm / original-mass

  • A inscrição Config: Imagens originais dos casos de massas comprimidas em PNG sem perdas.

  • Tamanho do download: 966.57 KiB

  • Tamanho do conjunto de dados: 4.80 GiB

  • desdobramentos:

Dividir Exemplos
'test' 348
'train' 1.166
  • Características:
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
        'id': tf.int32,
        'mask': Image(shape=(None, None, 1), dtype=tf.uint8),
        'mass_margins': ClassLabel(shape=(), dtype=tf.int64, num_classes=20),
        'mass_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=21),
        'pathology': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'id': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 1), dtype=tf.uint8),
    'patient': Text(shape=(), dtype=tf.string),
    'view': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
})

Visualização