imagenet_pi

  • 説明:

ImageNet-PI は、標準 ILSVRC2012 ImageNet データセットの再ラベル付けされたバージョンであり、標準 ILSVRC2012 で事前トレーニングされたさまざまなアーキテクチャを持つ 16 のディープ ニューラル ネットワークのコレクションによってラベルが提供されます。具体的には、事前トレーニング済みのモデルが tf.keras.applications からダウンロードされます。

新しいラベルに加えて、ImageNet-PI は、ラベルのモデルの信頼度と各モデルに関する追加情報の形式で、注釈プロセスに関するメタデータも提供します。

詳細については、次を参照してください: ImageNet-PI

  • ホームページ: https://github.com/google-research-datasets/imagenet_pi/

  • ソース コード: tfds.datasets.imagenet_pi.Builder

  • バージョン:

    • 1.0.0 (デフォルト): 初期リリース。
  • ダウンロードサイズ: Unknown size

  • データセットのサイズ: Unknown size

  • 手動ダウンロードの手順: このデータセットでは、ソース データを手動でdownload_config.manual_dir (デフォルトは~/tensorflow_datasets/downloads/manual/ ) にダウンロードする必要があります。
    manual_dir には、ILSVRC2012_img_train.tar と ILSVRC2012_img_val.tar の 2 つのファイルが含まれている必要があります。データセットをダウンロードするためのリンクを取得するには、 http://www.image-net.org/download-imagesに登録する必要があります。

  • 自動キャッシュ(ドキュメント): 不明

  • スプリット:

スプリット
  • 機能構造:
FeaturesDict({
    'annotator_confidences': Tensor(shape=(16,), dtype=float32),
    'annotator_labels': Tensor(shape=(16,), dtype=int64),
    'clean_label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
annotator_confidencesテンソル(16) float32
annotator_labelsテンソル(16) int64
clean_labelクラスラベルint64
ファイル名文章
画像画像(なし、なし、3) uint8
@inproceedings{tram,
  author    = {Mark Collier and
               Rodolphe Jenatton and
               Effrosyni Kokiopoulou and
               Jesse Berent},
  editor    = {Kamalika Chaudhuri and
               Stefanie Jegelka and
               Le Song and
               Csaba Szepesv{\'{a} }ri and
               Gang Niu and
               Sivan Sabato},
  title     = {Transfer and Marginalize: Explaining Away Label Noise with Privileged
               Information},
  booktitle = {International Conference on Machine Learning, {ICML} 2022, 17-23 July
               2022, Baltimore, Maryland, {USA} },
  series    = {Proceedings of Machine Learning Research},
  volume    = {162},
  pages     = {4219--4237},
  publisher = { {PMLR} },
  year      = {2022},
  url       = {https://proceedings.mlr.press/v162/collier22a.html},
}
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal   = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}
,

  • 説明:

ImageNet-PI は、標準 ILSVRC2012 ImageNet データセットの再ラベル付けされたバージョンであり、標準 ILSVRC2012 で事前トレーニングされたさまざまなアーキテクチャを持つ 16 のディープ ニューラル ネットワークのコレクションによってラベルが提供されます。具体的には、事前トレーニング済みのモデルが tf.keras.applications からダウンロードされます。

新しいラベルに加えて、ImageNet-PI は、ラベルのモデルの信頼度と各モデルに関する追加情報の形式で、注釈プロセスに関するメタデータも提供します。

詳細については、次を参照してください: ImageNet-PI

  • ホームページ: https://github.com/google-research-datasets/imagenet_pi/

  • ソース コード: tfds.datasets.imagenet_pi.Builder

  • バージョン:

    • 1.0.0 (デフォルト): 初期リリース。
  • ダウンロードサイズ: Unknown size

  • データセットのサイズ: Unknown size

  • 手動ダウンロードの手順: このデータセットでは、ソース データを手動でdownload_config.manual_dir (デフォルトは~/tensorflow_datasets/downloads/manual/ ) にダウンロードする必要があります。
    manual_dir には、ILSVRC2012_img_train.tar と ILSVRC2012_img_val.tar の 2 つのファイルが含まれている必要があります。データセットをダウンロードするためのリンクを取得するには、 http://www.image-net.org/download-imagesに登録する必要があります。

  • 自動キャッシュ(ドキュメント): 不明

  • スプリット:

スプリット
  • 機能構造:
FeaturesDict({
    'annotator_confidences': Tensor(shape=(16,), dtype=float32),
    'annotator_labels': Tensor(shape=(16,), dtype=int64),
    'clean_label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
annotator_confidencesテンソル(16) float32
annotator_labelsテンソル(16) int64
clean_labelクラスラベルint64
ファイル名文章
画像画像(なし、なし、3) uint8
@inproceedings{tram,
  author    = {Mark Collier and
               Rodolphe Jenatton and
               Effrosyni Kokiopoulou and
               Jesse Berent},
  editor    = {Kamalika Chaudhuri and
               Stefanie Jegelka and
               Le Song and
               Csaba Szepesv{\'{a} }ri and
               Gang Niu and
               Sivan Sabato},
  title     = {Transfer and Marginalize: Explaining Away Label Noise with Privileged
               Information},
  booktitle = {International Conference on Machine Learning, {ICML} 2022, 17-23 July
               2022, Baltimore, Maryland, {USA} },
  series    = {Proceedings of Machine Learning Research},
  volume    = {162},
  pages     = {4219--4237},
  publisher = { {PMLR} },
  year      = {2022},
  url       = {https://proceedings.mlr.press/v162/collier22a.html},
}
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal   = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}