imagenet2012_subset

Imagenet2012Subset は、元の ImageNet ILSVRC 2012 データセットのサブセットです。データセットは、元の ImageNet ILSVRC 2012 データセットと同じ検証セットを共有します。ただし、トレーニング セットはラベル バランス方式でサブサンプリングされます。 1pct構成、1%、または 12811 では、画像がサンプリングされ、ほとんどのクラスは同じ数の画像 (平均 12.8) を持ち、一部のクラスはランダムに他よりも 1 多いサンプルを持ちます。また、 10pct構成 (~10%、つまり 128116) では、ほとんどのクラスが同じ数の画像 (平均 128) を持ち、一部のクラスは他のクラスよりランダムに 1 つ多くの例を持ちます。

これは半教師あり学習のベンチマークとして使用されることになっており、もともとは SimCLR の論文 ( https://arxiv.org/abs/2002.05709 ) で使用されていました。

  • ホームページ: http://image-net.org/

  • ソース コード: tfds.datasets.imagenet2012_subset.Builder

  • バージョン:

    • 2.0.0 : 検証ラベルを修正しました。
    • 2.0.1 : エンコーディングの修正。ユーザーの観点からは変更はありません。
    • 3.0.0 : 12 個までの画像のカラー化を修正 (CMYK -> RGB)。一貫性を保つために形式を修正します (単一の png 画像を Jpeg に変換します)。アーカイブから直接世代を読み取る高速化。

    • 4.0.0 : (非公開)

    • 5.0.0 (デフォルト): 新しい分割 API ( https://tensorflow.org/datasets/splits )

    • 5.1.0 : テスト分割を追加。

  • 手動ダウンロードの手順: このデータセットでは、ソース データを手動でdownload_config.manual_dir (デフォルトは~/tensorflow_datasets/downloads/manual/ ) にダウンロードする必要があります。
    manual_dir には、ILSVRC2012_img_train.tar と ILSVRC2012_img_val.tar の 2 つのファイルが含まれている必要があります。データセットをダウンロードするためのリンクを取得するには、 https://image-net.org/download-imagesに登録する必要があります。

  • 自動キャッシュ(ドキュメント): いいえ

  • 機能構造:

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
ファイル名文章ストリング
画像画像(なし、なし、3) uint8
ラベルクラスラベルint64
@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset/1pct (デフォルト構成)

  • 構成の説明: ImageNet トレーニング セット全体の 1pct。

  • ダウンロードサイズ: 254.22 KiB

  • データセットサイズ: 7.61 GiB

  • スプリット:

スプリット
'train' 12,811
'validation' 50,000

視覚化

imagenet2012_subset/10pct

  • 構成の説明: ImageNet トレーニング セット全体の 10%。

  • ダウンロードサイズ: 2.48 MiB

  • データセットサイズ: 19.91 GiB

  • スプリット:

スプリット
'train' 128,116
'validation' 50,000

視覚化