imagenet2012_real

このデータセットには、ILSVRC-2012 (ImageNet) 検証画像が含まれており、"Are we done with ImageNet" ペーパーからの "Re-Assessed" (Real) ラベルの新しいセットで補強されています。https: //arxiv.org/abs/2006.07159を参照してください。拡張プロトコルを使用してラベルが収集されるため、マルチラベルでより正確な注釈が得られます。

重要な注意: 約 3500 の例にはラベルが含まれていません。これらは、精度を計算する際の平均化から除外する必要があります。これを行う 1 つの可能な方法は、次の NumPy コードを使用することです。

is_correct = [pred in real_labels[i] for i, pred in enumerate(predictions) if real_labels[i]]
real_accuracy = np.mean(is_correct)
  • ホームページ: https://github.com/google-research/reassessed-imagenet

  • ソース コード: tfds.datasets.imagenet2012_real.Builder

  • バージョン:

    • 1.0.0 (デフォルト): 初期リリース
  • ダウンロードサイズ: 379.37 KiB

  • データセットサイズ: 6.25 GiB

  • 手動ダウンロードの手順: このデータセットでは、ソース データを手動でdownload_config.manual_dir (デフォルトは~/tensorflow_datasets/downloads/manual/ ) にダウンロードする必要があります。
    manual_dir にはILSVRC2012_img_val.tarファイルが含まれている必要があります。データセットをダウンロードするためのリンクを取得するには、 http://www.image-net.org/download-imagesに登録する必要があります。

  • 自動キャッシュ(ドキュメント): いいえ

  • スプリット:

スプリット
'validation' 50,000
  • 機能構造:
FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'original_label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
    'real_label': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=1000)),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
ファイル名文章ストリング
画像画像(なし、なし、3) uint8
original_labelクラスラベルint64
real_labelシーケンス(クラスラベル) (なし、) int64

視覚化

  • 引用
@article{beyer2020imagenet,
  title={Are we done with ImageNet?},
  author={Lucas Beyer and Olivier J. Henaff and Alexander Kolesnikov and Xiaohua Zhai and Aaron van den Oord},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author={Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title={ {ImageNet Large Scale Visual Recognition Challenge} },
  Year={2015},
  journal={International Journal of Computer Vision (IJCV)},
  doi={10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}