curated_breast_imaging_ddsm,curated_breast_imaging_ddsm

CBIS-DDSM (Curated Breast Imaging Subset of DDSM) to zaktualizowana i ustandaryzowana wersja cyfrowej bazy danych do mammografii przesiewowej (DDSM). DDSM to baza danych zawierająca 2620 zeskanowanych badań mammograficznych. Zawiera normalne, łagodne i złośliwe przypadki ze zweryfikowanymi informacjami patologicznymi.

Domyślna konfiguracja składa się z łat wyodrębnionych z oryginalnych mammogramów, zgodnie z opisem z ( http://arxiv.org/abs/1708.09427 ), w celu ułożenia zadania do rozwiązania w tradycyjnym ustawieniu klasyfikacji obrazów.

Ponieważ do pobierania i odczytywania obrazów zawartych w zbiorze danych potrzebne jest specjalne oprogramowanie i biblioteki, TFDS zakłada, że ​​użytkownik pobrał oryginalne pliki DCIM i przekonwertował je na format PNG.

Następujące polecenia (lub ich odpowiedniki) powinny być używane do generowania plików PNG, aby zagwarantować powtarzalność wyników:

find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'

Wynikowe obrazy należy umieścić w manual_dir , na przykład: <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png .

@misc{CBIS_DDSM_Citation,
  doi = {10.7937/k9/tcia.2016.7o02s9cy},
  url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
  author = {Sawyer-Lee,  Rebecca and Gimenez,  Francisco and Hoogi,  Assaf and Rubin,  Daniel},
  title = {Curated Breast Imaging Subset of DDSM},
  publisher = {The Cancer Imaging Archive},
  year = {2016},
}
@article{TCIA_Citation,
  author = {
    K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
    P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
    L. Tarbox and F. Prior
  },
  title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
  Public Information Repository} },
  journal = {Journal of Digital Imaging},
  volume = {26},
  month = {December},
  year = {2013},
  pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
  author    = {Li Shen},
  title     = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
               An All Convolutional Design},
  journal   = {CoRR},
  volume    = {abs/1708.09427},
  year      = {2017},
  url       = {http://arxiv.org/abs/1708.09427},
  archivePrefix = {arXiv},
  eprint    = {1708.09427},
  timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

curated_breast_imaging_ddsm/patches (domyślna konfiguracja)

  • Opis konfiguracji : Łaty zawierające przypadki zwapnień i mas oraz ścieżki bez nieprawidłowości. Zaprojektowany jako tradycyjne 5-klasowe zadanie klasyfikacyjne.

  • Rozmiar pliku do pobrania : 2.01 MiB

  • Rozmiar zestawu danych : 801.46 MiB

  • Podziały :

Podział Przykłady
'test' 9770
'train' 49780
'validation' 5580
  • Struktura funkcji :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
ID Tekst strunowy
obraz Obraz (Brak, Brak, 1) uint8
etykieta Etykieta klasy int64

Wyobrażanie sobie

curated_breast_imaging_ddsm/original-calc

  • Opis konfiguracji : Oryginalne obrazy przypadków zwapnień skompresowane w bezstratnym formacie PNG.

  • Rozmiar pliku do pobrania : 1.06 MiB

  • Rozmiar zestawu danych : 4.42 GiB

  • Podziały :

Podział Przykłady
'test' 284
'train' 1227
  • Struktura funkcji :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'calc_distribution': ClassLabel(shape=(), dtype=int64, num_classes=10),
        'calc_type': ClassLabel(shape=(), dtype=int64, num_classes=48),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
nieprawidłowości Sekwencja
nieprawidłowości/ocena Etykieta klasy int64
nieprawidłowości/calc_distribution Etykieta klasy int64
nieprawidłowości/calc_type Etykieta klasy int64
nieprawidłowości/id Napinacz int32
nieprawidłowości/maska Obraz (Brak, Brak, 1) uint8
nieprawidłowości/patologia Etykieta klasy int64
nieprawidłowości/subtelność Etykieta klasy int64
pierś Etykieta klasy int64
ID Tekst strunowy
obraz Obraz (Brak, Brak, 1) uint8
pacjent Tekst strunowy
pogląd Etykieta klasy int64

Wyobrażanie sobie

curated_breast_imaging_ddsm/original-mass

  • Opis konfiguracji : Oryginalne obrazy przypadków masowych skompresowane w bezstratnym formacie PNG.

  • Rozmiar pliku do pobrania : 966.57 KiB

  • Rozmiar zestawu danych : 4.80 GiB

  • Podziały :

Podział Przykłady
'test' 348
'train' 1166
  • Struktura funkcji :
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=int64, num_classes=6),
        'id': int32,
        'mask': Image(shape=(None, None, 1), dtype=uint8),
        'mass_margins': ClassLabel(shape=(), dtype=int64, num_classes=20),
        'mass_shape': ClassLabel(shape=(), dtype=int64, num_classes=21),
        'pathology': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 1), dtype=uint8),
    'patient': Text(shape=(), dtype=string),
    'view': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
nieprawidłowości Sekwencja
nieprawidłowości/ocena Etykieta klasy int64
nieprawidłowości/id Napinacz int32
nieprawidłowości/maska Obraz (Brak, Brak, 1) uint8
nieprawidłowości/masa_marginesów Etykieta klasy int64
nieprawidłowości/kształt_masy Etykieta klasy int64
nieprawidłowości/patologia Etykieta klasy int64
nieprawidłowości/subtelność Etykieta klasy int64
pierś Etykieta klasy int64
ID Tekst strunowy
obraz Obraz (Brak, Brak, 1) uint8
pacjent Tekst strunowy
pogląd Etykieta klasy int64

Wyobrażanie sobie