imagenet2012

一般に「ImageNet」として知られるILSVRC2012は、WordNet階層に従って編成された画像データセットです。 WordNetの意味のある各概念は、複数の単語または単語フレーズで記述されている可能性があり、「同義語セット」または「同義語セット」と呼ばれます。 WordNetには100,000を超えるシンセットがあり、それらの大部分は名詞(80,000以上)です。 ImageNetでは、各シンセットを説明するために平均1000枚の画像を提供することを目指しています。各コンセプトの画像は、品質管理され、人間が注釈を付けています。完成時には、ImageNetがWordNet階層のほとんどの概念に対して何千万ものきれいにソートされた画像を提供することを願っています。

テスト分割には100Kの画像が含まれていますが、ラベルが公開されていないため、ラベルは含まれていません。 2019年10月10日にリリースされたマイナーパッチで2012年からのテスト分割のサポートを提供します。このデータを手動でダウンロードするには、ユーザーは次の操作を実行する必要があります。

  1. 2012テスト分割が可能なダウンロードここ
  2. 2019年10月10日のパッチをダウンロードします。同じページで提供されているパッチへのGoogleドライブのリンクがあります。
  3. 2つのタールボールを組み合わせて、元のアーカイブ内の画像をパッチの画像で手動で上書きします。 image-net.orgの指示によると、この手順はほんの数枚の画像を上書きします。

結果として得られるtar-ballは、TFDSによって処理されます。

ImageNetテスト分割でモデルの精度を評価するには、分割内のすべての画像に対して推論を実行し、それらの結果をImageNet評価サーバーにアップロードする必要があるテキストファイルにエクスポートする必要があります。 ImageNet評価サーバーのメンテナは、過剰適合を防ぐために、1人のユーザーが1週間に最大2件の提出を許可します。

テスト分割の精度を評価するには、最初にimage-net.orgでアカウントを作成する必要があります。このアカウントは、サイト管理者によって承認される必要があります。アカウントが作成された後、1の時にテストサーバーに結果を提出することができますhttps://image-net.org/challenges/LSVRC/eval_server.php提出は、複数のタスクに対応するいくつかのASCIIテキストファイルで構成されています。関心のあるタスクは「分類の送信(上位5つのclsエラー)」です。エクスポートされたテキストファイルのサンプルは次のようになります。

771 778 794 387 650
363 691 764 923 427
737 369 430 531 124
755 930 755 59 168

:エクスポート形式は、ここで利用できる2013の開発キットの中に「README.TXT」でいっぱいに記述されているhttp://imagenet.stanford.edu/image/ilsvrc2013/ILSVRC2013_devkit.tgzと題したセクションを参照してください「3.3 CLS-LOCの提出形式"。簡単に言うと、テキストファイルの形式は、テスト分割の各画像に対応する100,000行です。整数の各行は、各テスト画像のランク付けされた上位5つの予測に対応します。整数は、対応するラベルファイルの行番号に対応する1インデックスです。 imagenet2012_labels.txtを参照してください。

  • ホームページhttp://image-net.org/

  • ソースコードtfds.image_classification.Imagenet2012

  • バージョン

    • 2.0.0 :修正の検証のラベル。
    • 2.0.1 :エンコードの修正。ユーザーの観点からの変更はありません。
    • 3.0.0 :〜12画像に修正色付け(CMYK - > RGB)。一貫性のためにフォーマットを修正しました(単一のpng画像をJpegに変換します)。アーカイブから直接読み取る高速世代。

    • 4.0.0 :(未発表)

    • 5.0.0 :新しいスプリットAPI( https://tensorflow.org/datasets/splits

    • 5.1.0 (デフォルト):追加のテスト分割。

  • ダウンロードサイズUnknown size

  • データセットのサイズ155.84 GiB

  • マニュアルダウンロード方法:このデータセットは、手動にソースデータをダウンロードする必要がありますdownload_config.manual_dir (デフォルトは~/tensorflow_datasets/downloads/manual/ ):
    manual_dirには、ILSVRC2012_img_train.tarとILSVRC2012_img_val.tarの2つのファイルが含まれている必要があります。あなたはに登録する必要がhttp://www.image-net.org/download-imagesデータセットをダウンロードするためのリンクを得るために。

  • オートキャッシュされたドキュメント):いいえ

  • スプリット

スプリット
'test' 100,000
'train' 1,281,167
'validation' 50,000
  • 特長
FeaturesDict({
    'file_name': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=1000),
})

視覚化

  • 引用
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal   = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}