imagenet2012_subset

Imagenet2012Subsetは、元のImageNet ILSVRC2012データセットのサブセットです。データセットを共有元ImageNet ILSVRC 2012データセットと同じ検証セット。ただし、トレーニングセットは、ラベルバランスの取れた方法でサブサンプリングされます。 1pct構成、1%、または12811、画像がサンプリングされ、ほとんどのクラスは、画像(平均12.8)の同じ数を有する、いくつかのクラスは、ランダムに他のものよりも1以上の例を持っています。そして、で10pct構成、〜10%、または128116は、ほとんどのクラスは、画像(平均128)の同じ数を有し、いくつかのクラスは、ランダムに他のものよりも1つの以上の例を持っています。

これは、(半教師あり学習のためのベンチマークとして使用されることになっており、本来はSimCLR紙に使用されてきたhttps://arxiv.org/abs/2002.05709 )。

  • ホームページhttp://image-net.org/

  • ソースコードtfds.image_classification.Imagenet2012Subset

  • バージョン

    • 2.0.0 :修正の検証のラベル。
    • 2.0.1 :エンコードの修正。ユーザーの観点からの変更はありません。
    • 3.0.0 :〜12画像に修正色付け(CMYK - > RGB)。一貫性のためにフォーマットを修正しました(単一のpng画像をJpegに変換します)。アーカイブから直接読み取る高速世代。

    • 4.0.0 :(未発表)

    • 5.0.0 (デフォルト):新しいスプリットAPI( https://tensorflow.org/datasets/splits

    • 5.1.0 :追加のテスト分割。

  • マニュアルダウンロード方法:このデータセットは、手動にソースデータをダウンロードする必要がありますdownload_config.manual_dir (デフォルトは~/tensorflow_datasets/downloads/manual/ ):
    manual_dirには、ILSVRC2012_img_train.tarとILSVRC2012_img_val.tarの2つのファイルが含まれている必要があります。あなたはに登録する必要がhttp://www.image-net.org/download-imagesデータセットをダウンロードするためのリンクを得るために。

  • オートキャッシュされたドキュメント):いいえ

  • 特長

FeaturesDict({
    'file_name': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=1000),
})
@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset / 1pct(デフォルト設定)

  • コンフィグの説明:総ImageNetトレーニングセットの1pct。

  • ダウンロードサイズ254.22 KiB

  • データセットサイズ7.61 GiB

  • スプリット

スプリット
'train' 12,811
'validation' 50,000

視覚化

imagenet2012_subset / 10pct

  • コンフィグの説明:総ImageNetトレーニングセットの10pct。

  • ダウンロードサイズ2.48 MiB

  • データセットサイズ19.91 GiB

  • スプリット

スプリット
'train' 128,116
'validation' 50,000

視覚化