cifar10_1

CIFAR-10.1データセットは、CIFAR-10の新しいテストセットです。 CIFAR-10.1には、元のCIFAR-10データセットに関する複数年の調査の後にサンプリングされた約2,000の新しいテスト画像が含まれています。 CIFAR-10.1のデータ収集は、元のデータセットに対する分布のシフトを最小限に抑えるように設計されています。 CIFAR-10.1の作成については、「CIFAR-10分類子はCIFAR-10に一般化されますか?」という論文で説明しています。 CIFAR-10.1の画像は、TinyImagesデータセットのサブセットです。現在、CIFAR-10.1データセットにはv4とv6の2つのバージョンがあります。

FeaturesDict({
    'image': Image(shape=(32, 32, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
})
@article{recht2018cifar10.1,
  author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
  title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
  year = {2018},
  note = {\url{https://arxiv.org/abs/1806.00451} },
}

@article{torralba2008tinyimages,
  author = {Antonio Torralba and Rob Fergus and William T. Freeman},
  journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
  year = {2008},
  volume = {30},
  number = {11},
  pages = {1958-1970}
}

cifar10_1 / v4(デフォルト設定)

  • コンフィグの説明:それは私たちがどの分類器をテストした上で、当社のデータセットの最初のバージョンです。上記のように、これにより、v4データセットは評価する分類子から独立します。私たちの論文の主要なセクションで報告されている数値は、このバージョンのデータセットを使用しています。これは、各クラスの上位25のTinyImagesキーワードから作成されたため、クラスのわずかな不均衡が発生しました。最大の違いは、船がテストセットの10%ではなく8%しか占めていないことです。 v4には2,021枚の画像が含まれています。

  • ダウンロードサイズ5.93 MiB

  • データセットサイズ4.46 MiB

  • スプリット

スプリット
'test' 2,021

視覚化

cifar10_1 / v6

  • 設定の説明:これは、丁度クラスバランスがわずかに改善されたキーワード割り当てに由来します。このバージョンのデータセットは、本書の付録Dの結果に対応しています。 v6には2,000枚の画像が含まれています。

  • ダウンロードサイズ5.87 MiB

  • データセットサイズ4.40 MiB

  • スプリット

スプリット
'test' 2,000

視覚化