imagenet_v2

ImageNet-v2 は、元のラベリング プロトコルに厳密に従って収集された ImageNet テスト セット (クラスごとに 10 個) です。各画像は、少なくとも 10 人、場合によってはそれ以上の MTurk ワーカーによってラベル付けされており、特定のクラスに選択された 10 の画像からどの画像を含めるかを選択するために使用される戦略に応じて、データセットの 3 つの異なるバージョンがあります。さまざまな亜種がどのようにコンパイルされたかの詳細については、論文のセクション 4 を参照してください。

ラベルスペースはImageNet2012と同じです。各例は、次のキーを持つ辞書として表されます。

  • 'image': 画像、(H, W, 3)-テンソル。
  • 「ラベル」: [0, 1000) の範囲の整数。
  • 'file_name': データセット内の例を識別する一意の文字列。

  • ホームページ: https://github.com/modestyachts/ImageNetV2

  • ソース コード: tfds.datasets.imagenet_v2.Builder

  • バージョン:

    • 1.0.0 : 初期バージョン。
    • 2.0.0 : ファイルが更新されました。
    • 3.0.0 (デフォルト): file_name を絶対パスからデータ ディレクトリへの相対パスに修正します。つまり、"class_id/filename.jpg" です。
    • 3.1.0 : Hugging Face のリソースの新しい URL。
  • 自動キャッシュ(ドキュメント): いいえ

  • スプリット:

スプリット
'test' 10,000
  • 機能構造:
FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
ファイル名文章
画像画像(なし、なし、3) uint8
ラベルクラスラベルint64
@inproceedings{recht2019imagenet,
  title={Do ImageNet Classifiers Generalize to ImageNet?},
  author={Recht, Benjamin and Roelofs, Rebecca and Schmidt, Ludwig and Shankar, Vaishaal},
  booktitle={International Conference on Machine Learning},
  pages={5389--5400},
  year={2019}
}

imagenet_v2/matched-frequency (デフォルト設定)

  • ダウンロードサイズ: 1.18 GiB

  • データセットサイズ: 1.16 GiB

  • ( tfds.show_examples ):

視覚化

imagenet_v2/threshold-0.7

  • ダウンロードサイズ: 1.16 GiB

  • データセットサイズ: 1.15 GiB

  • ( tfds.show_examples ):

視覚化

imagenet_v2/topimages

  • ダウンロードサイズ: 1.16 GiB

  • データセットサイズ: 1.14 GiB

  • ( tfds.show_examples ):

視覚化