¡El Día de la Comunidad de ML es el 9 de noviembre! Únase a nosotros para recibir actualizaciones de TensorFlow, JAX, y más Más información

curated_breast_imaging_ddsm

El CBIS-DDSM (subconjunto de imágenes de mama curadas de DDSM) es una versión actualizada y estandarizada de la base de datos digital para mamografías de detección (DDSM). El DDSM es una base de datos de 2620 estudios de mamografía con película escaneada. Contiene casos normales, benignos y malignos con información patológica verificada.

La configuración por defecto es de parches extraídos de las mamografías originales, siguiendo la descripción de http://arxiv.org/abs/1708.09427, con el fin de enmarcar la tarea de resolver en un entorno tradicional clasificación de imágenes.

Debido a que se necesitan bibliotecas y software especiales para descargar y leer las imágenes contenidas en el conjunto de datos, TFDS asume que el usuario ha descargado los archivos DCIM originales y los ha convertido a PNG.

Los siguientes comandos (o equivalentes) deben usarse para generar los archivos PNG, con el fin de garantizar resultados reproducibles:

find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'

Imágenes resultantes se deben poner en manual_dir , como: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png .

@misc{CBIS_DDSM_Citation,
  doi = {10.7937/k9/tcia.2016.7o02s9cy},
  url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
  author = {Sawyer-Lee,  Rebecca and Gimenez,  Francisco and Hoogi,  Assaf and Rubin,  Daniel},
  title = {Curated Breast Imaging Subset of DDSM},
  publisher = {The Cancer Imaging Archive},
  year = {2016},
}
@article{TCIA_Citation,
  author = {
    K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
    P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
    L. Tarbox and F. Prior
  },
  title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
  Public Information Repository} },
  journal = {Journal of Digital Imaging},
  volume = {26},
  month = {December},
  year = {2013},
  pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
  author    = {Li Shen},
  title     = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
               An All Convolutional Design},
  journal   = {CoRR},
  volume    = {abs/1708.09427},
  year      = {2017},
  url       = {http://arxiv.org/abs/1708.09427},
  archivePrefix = {arXiv},
  eprint    = {1708.09427},
  timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

curated_breast_imaging_ddsm / patches (configuración predeterminada)

  • Descripción de config: Parches que contienen tanto calsification y casos en masa, más pathces sin anormalidades. Diseñado como una tarea de clasificación tradicional de 5 clases.

  • Tamaño del paquete: 2.01 MiB

  • Conjunto de datos de tamaño: 801.46 MiB

  • Fraccionamientos:

Separar Ejemplos de
'test' 9,770
'train' 49,780
'validation' 5.580
  • características:
FeaturesDict({
    'id': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 1), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
})

Visualización

curated_breast_imaging_ddsm / original-calc

  • Descripción config: Las imágenes originales de los casos de calcificación comprimidos en PNG sin pérdida.

  • Tamaño del paquete: 1.06 MiB

  • Tamaño de conjunto de datos: 4.42 GiB

  • Fraccionamientos:

Separar Ejemplos de
'test' 284
'train' 1,227
  • características:
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
        'calc_distribution': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
        'calc_type': ClassLabel(shape=(), dtype=tf.int64, num_classes=48),
        'id': tf.int32,
        'mask': Image(shape=(None, None, 1), dtype=tf.uint8),
        'pathology': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'id': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 1), dtype=tf.uint8),
    'patient': Text(shape=(), dtype=tf.string),
    'view': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
})

Visualización

curated_breast_imaging_ddsm / original-mass

  • Descripción config: Las imágenes originales de los casos masa comprimida en PNG sin pérdida.

  • Tamaño del paquete: 966.57 KiB

  • Tamaño de conjunto de datos: 4.80 GiB

  • Fraccionamientos:

Separar Ejemplos de
'test' 348
'train' 1,166
  • características:
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
        'id': tf.int32,
        'mask': Image(shape=(None, None, 1), dtype=tf.uint8),
        'mass_margins': ClassLabel(shape=(), dtype=tf.int64, num_classes=20),
        'mass_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=21),
        'pathology': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'id': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 1), dtype=tf.uint8),
    'patient': Text(shape=(), dtype=tf.string),
    'view': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
})

Visualización