Pomoc chronić Wielkiej Rafy Koralowej z TensorFlow na Kaggle Dołącz Wyzwanie

curated_breast_imaging_ddsm

CBIS-DDSM (Cuated Breast Imaging Subset of DDSM) jest zaktualizowaną i ustandaryzowaną wersją cyfrowej bazy danych mammografii przesiewowej (DDSM). DDSM to baza danych obejmująca 2620 zeskanowanych badań mammografii filmowej. Zawiera normalne, łagodne i złośliwe przypadki ze zweryfikowanymi informacjami o patologii.

Domyślny konfiguracji jest wykonana z łat uzyskanych z pierwotnych mammografii, zgodnie z opisem z http://arxiv.org/abs/1708.09427, aby ukształtować za zadanie rozwiązać w tradycyjnej klasyfikacji obrazu.

Ponieważ do pobrania i odczytania obrazów zawartych w zestawie danych potrzebne jest specjalne oprogramowanie i biblioteki, TFDS zakłada, że ​​użytkownik pobrał oryginalne pliki DCIM i przekonwertował je do formatu PNG.

Poniższe polecenia (lub równoważne) powinny być używane do generowania plików PNG, aby zagwarantować powtarzalne wyniki:

find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'

Powstałe obrazy powinny być umieszczone w manual_dir , jak: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png .

@misc{CBIS_DDSM_Citation,
  doi = {10.7937/k9/tcia.2016.7o02s9cy},
  url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
  author = {Sawyer-Lee,  Rebecca and Gimenez,  Francisco and Hoogi,  Assaf and Rubin,  Daniel},
  title = {Curated Breast Imaging Subset of DDSM},
  publisher = {The Cancer Imaging Archive},
  year = {2016},
}
@article{TCIA_Citation,
  author = {
    K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
    P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
    L. Tarbox and F. Prior
  },
  title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
  Public Information Repository} },
  journal = {Journal of Digital Imaging},
  volume = {26},
  month = {December},
  year = {2013},
  pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
  author    = {Li Shen},
  title     = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
               An All Convolutional Design},
  journal   = {CoRR},
  volume    = {abs/1708.09427},
  year      = {2017},
  url       = {http://arxiv.org/abs/1708.09427},
  archivePrefix = {arXiv},
  eprint    = {1708.09427},
  timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

curated_breast_imaging_ddsm/patches (konfiguracja domyślna)

  • Opis konfiguracji: Plastry zawierające zarówno calsification i masy, a także przypadki pathces bez wad. Zaprojektowany jako tradycyjne zadanie klasyfikacyjne 5-klasowe.

  • Wielkość pliku: 2.01 MiB

  • Zbiór danych rozmiar: 801.46 MiB

  • dzieli:

Podział Przykłady
'test' 9770
'train' 49 780
'validation' 5580
  • Cechy:
FeaturesDict({
    'id': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 1), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
})

Wyobrażanie sobie

curated_breast_imaging_ddsm/original-calc

  • Opis config: Oryginalne obrazy przypadkach osadzaniu się wapna skompresowanych w bezstratnej PNG.

  • Wielkość pliku: 1.06 MiB

  • Zbiór danych rozmiar: 4.42 GiB

  • dzieli:

Podział Przykłady
'test' 284
'train' 1227
  • Cechy:
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
        'calc_distribution': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
        'calc_type': ClassLabel(shape=(), dtype=tf.int64, num_classes=48),
        'id': tf.int32,
        'mask': Image(shape=(None, None, 1), dtype=tf.uint8),
        'pathology': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'id': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 1), dtype=tf.uint8),
    'patient': Text(shape=(), dtype=tf.string),
    'view': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
})

Wyobrażanie sobie

curated_breast_imaging_ddsm/original-mass

  • Opis config: Oryginalne obrazy przypadków masowych skompresowanych w bezstratnej PNG.

  • Wielkość pliku: 966.57 KiB

  • Zestaw danych rozmiar: 4.80 GiB

  • dzieli:

Podział Przykłady
'test' 348
'train' 1166
  • Cechy:
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
        'id': tf.int32,
        'mask': Image(shape=(None, None, 1), dtype=tf.uint8),
        'mass_margins': ClassLabel(shape=(), dtype=tf.int64, num_classes=20),
        'mass_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=21),
        'pathology': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'id': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 1), dtype=tf.uint8),
    'patient': Text(shape=(), dtype=tf.string),
    'view': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
})

Wyobrażanie sobie