¡El Día de la Comunidad de ML es el 9 de noviembre! Únase a nosotros para recibir actualizaciones de TensorFlow, JAX, y más Más información

stl10

  • Descripción:

El conjunto de datos STL-10 es un conjunto de datos de reconocimiento de imágenes para desarrollar algoritmos de aprendizaje autodidacta, aprendizaje profundo y aprendizaje de funciones no supervisado. Está inspirado en el conjunto de datos CIFAR-10 pero con algunas modificaciones. En particular, cada clase tiene menos ejemplos de capacitación etiquetados que en CIFAR-10, pero se proporciona un conjunto muy grande de ejemplos no etiquetados para aprender modelos de imágenes antes de la capacitación supervisada. El desafío principal es hacer uso de los datos sin etiquetar (que provienen de una distribución similar pero diferente de los datos etiquetados) para construir un a priori útil. Todas las imágenes se obtuvieron de ejemplos etiquetados en ImageNet.

Separar Ejemplos de
'test' 8.000
'train' 5,000
'unlabelled' 100.000
  • características:
FeaturesDict({
    'image': Image(shape=(96, 96, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
})

Visualización

  • Cita:
@inproceedings{coates2011stl10,
  title={ {An Analysis of Single Layer Networks in Unsupervised Feature Learning} },
  author={Coates, Adam and Ng, Andrew and Lee, Honglak},
  booktitle={AISTATS},
  year={2011},
  note = {\url{https://cs.stanford.edu/~acoates/papers/coatesleeng_aistats_2011.pdf} },
}