stl10

  • 説明

STL-10データセットは、教師なし特徴学習、深層学習、自習学習アルゴリズムを開発するための画像認識データセットです。これはCIFAR-10データセットに触発されていますが、いくつかの変更が加えられています。特に、各クラスにはCIFAR-10よりもラベル付きのトレーニング例が少なくなっていますが、教師ありトレーニングの前に画像モデルを学習するために、ラベルなしの例の非常に多くのセットが提供されています。主な課題は、ラベルのないデータ(ラベルの付いたデータと類似しているが異なる分布に由来する)を利用して、有用な事前分布を構築することです。すべての画像は、ImageNetのラベル付きの例から取得されました。

スプリット
'test' 8,000
'train' 5,000
'unlabelled' 100,000
  • 特長
FeaturesDict({
    'image': Image(shape=(96, 96, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
})

視覚化

  • 引用
@inproceedings{coates2011stl10,
  title={ {An Analysis of Single Layer Networks in Unsupervised Feature Learning} },
  author={Coates, Adam and Ng, Andrew and Lee, Honglak},
  booktitle={AISTATS},
  year={2011},
  note = {\url{https://cs.stanford.edu/~acoates/papers/coatesleeng_aistats_2011.pdf} },
}