stl10

  • Description:

L'ensemble de données STL-10 est un ensemble de données de reconnaissance d'images pour le développement d'algorithmes d'apprentissage non supervisé, d'apprentissage en profondeur et d'apprentissage autodidacte. Il est inspiré du jeu de données CIFAR-10 mais avec quelques modifications. En particulier, chaque classe a moins d'exemples de formation étiquetés que dans CIFAR-10, mais un très grand ensemble d'exemples non étiquetés est fourni pour apprendre les modèles d'images avant la formation supervisée. Le principal défi consiste à utiliser les données non étiquetées (qui proviennent d'une distribution similaire mais différente des données étiquetées) pour construire un a priori utile. Toutes les images ont été acquises à partir d'exemples étiquetés sur ImageNet.

Diviser Exemples
'test' 8 000
'train' 5 000
'unlabelled' 100 000
  • Caractéristiques:
FeaturesDict({
    'image': Image(shape=(96, 96, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
})

Visualisation

  • citation:
@inproceedings{coates2011stl10,
  title={ {An Analysis of Single Layer Networks in Unsupervised Feature Learning} },
  author={Coates, Adam and Ng, Andrew and Lee, Honglak},
  booktitle={AISTATS},
  year={2011},
  note = {\url{https://cs.stanford.edu/~acoates/papers/coatesleeng_aistats_2011.pdf} },
}