curated_breast_imaging_ddsm

CBIS-DDSM(DDSMのCurated Breast Imaging Subset)は、マンモグラフィ検診用デジタルデータベース(DDSM)の更新および標準化されたバージョンです。 DDSMは、2,620件のスキャンされたフィルムマンモグラフィ研究のデータベースです。これには、病理情報が検証された正常、良性、および悪性の症例が含まれています。

デフォルトの設定は、から説明以下、原マンモグラムから抽出されたパッチで構成されている、http://arxiv.org/abs/1708.09427伝統的な画像分類設定で解決するタスクをフレームするために。

データセットに含まれる画像をダウンロードして読み取るには特別なソフトウェアとライブラリが必要なため、TFDSは、ユーザーが元のDCIMファイルをダウンロードしてPNGに変換したと想定します。

再現性のある結果を保証するには、次のコマンド(または同等のコマンド)を使用してPNGファイルを生成する必要があります。

find $DATASET_DCIM_DIR -name '*.dcm' | \
xargs -n1 -P8 -I{} bash -c 'f={}; dcmj2pnm $f | convert - ${f/.dcm/.png}'

得られる画像はで配置する必要がありますmanual_dir :のように、 <manual_dir>/Mass-Training_P_01981_RIGHT_MLO_1/1.3.6.../000000.png

@misc{CBIS_DDSM_Citation,
  doi = {10.7937/k9/tcia.2016.7o02s9cy},
  url = {https://wiki.cancerimagingarchive.net/x/lZNXAQ},
  author = {Sawyer-Lee,  Rebecca and Gimenez,  Francisco and Hoogi,  Assaf and Rubin,  Daniel},
  title = {Curated Breast Imaging Subset of DDSM},
  publisher = {The Cancer Imaging Archive},
  year = {2016},
}
@article{TCIA_Citation,
  author = {
    K. Clark and B. Vendt and K. Smith and J. Freymann and J. Kirby and
    P. Koppel and S. Moore and S. Phillips and D. Maffitt and M. Pringle and
    L. Tarbox and F. Prior
  },
  title = { {The Cancer Imaging Archive (TCIA): Maintaining and Operating a
  Public Information Repository} },
  journal = {Journal of Digital Imaging},
  volume = {26},
  month = {December},
  year = {2013},
  pages = {1045-1057},
}
@article{DBLP:journals/corr/abs-1708-09427,
  author    = {Li Shen},
  title     = {End-to-end Training for Whole Image Breast Cancer Diagnosis using
               An All Convolutional Design},
  journal   = {CoRR},
  volume    = {abs/1708.09427},
  year      = {2017},
  url       = {http://arxiv.org/abs/1708.09427},
  archivePrefix = {arXiv},
  eprint    = {1708.09427},
  timestamp = {Mon, 13 Aug 2018 16:48:35 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1708-09427},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

curated_breast_imaging_ddsm / patchs(デフォルト設定)

  • 設定の説明:異常なしとcalsification及び質量場合、プラスpathces両方を含むパッチ。従来の5クラス分類タスクとして設計されています。

  • ダウンロードサイズ2.01 MiB

  • データセットのサイズ801.46 MiB

  • スプリット

スプリット
'test' 9,770
'train' 49,780
'validation' 5,580
  • 特長
FeaturesDict({
    'id': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 1), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
})

視覚化

curated_breast_imaging_ddsm / original-calc

  • コンフィグの説明:ロスレスPNGで圧縮された石灰化の例オリジナル画像。

  • ダウンロードサイズ1.06 MiB

  • データセットサイズ4.42 GiB

  • スプリット

スプリット
'test' 284
'train' 1,227
  • 特長
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
        'calc_distribution': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
        'calc_type': ClassLabel(shape=(), dtype=tf.int64, num_classes=48),
        'id': tf.int32,
        'mask': Image(shape=(None, None, 1), dtype=tf.uint8),
        'pathology': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'id': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 1), dtype=tf.uint8),
    'patient': Text(shape=(), dtype=tf.string),
    'view': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
})

視覚化

curated_breast_imaging_ddsm / original-mass

  • コンフィグの説明:ロスレスPNGで圧縮された質量例オリジナル画像。

  • ダウンロードサイズ966.57 KiB

  • データセットサイズ4.80 GiB

  • スプリット

スプリット
'test' 348
'train' 1,166
  • 特長
FeaturesDict({
    'abnormalities': Sequence({
        'assessment': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
        'id': tf.int32,
        'mask': Image(shape=(None, None, 1), dtype=tf.uint8),
        'mass_margins': ClassLabel(shape=(), dtype=tf.int64, num_classes=20),
        'mass_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=21),
        'pathology': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
        'subtlety': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    }),
    'breast': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'id': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 1), dtype=tf.uint8),
    'patient': Text(shape=(), dtype=tf.string),
    'view': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
})

視覚化