O Dia da Comunidade de ML é dia 9 de novembro! Junte-nos para atualização de TensorFlow, JAX, e mais Saiba mais

stl10

  • Descrição:

O conjunto de dados STL-10 é um conjunto de dados de reconhecimento de imagem para o desenvolvimento de aprendizado de recursos não supervisionado, aprendizado profundo e algoritmos de aprendizado autodidata. É inspirado no conjunto de dados CIFAR-10, mas com algumas modificações. Em particular, cada classe tem menos exemplos de treinamento rotulados do que no CIFAR-10, mas um grande conjunto de exemplos não rotulados é fornecido para aprender modelos de imagem antes do treinamento supervisionado. O principal desafio é fazer uso dos dados não rotulados (que vêm de uma distribuição semelhante, mas diferente dos dados rotulados) para construir um anterior útil. Todas as imagens foram adquiridas de exemplos rotulados na ImageNet.

Dividir Exemplos
'test' 8.000
'train' 5.000
'unlabelled' 100.000
  • Características:
FeaturesDict({
    'image': Image(shape=(96, 96, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
})

Visualização

  • citação:
@inproceedings{coates2011stl10,
  title={ {An Analysis of Single Layer Networks in Unsupervised Feature Learning} },
  author={Coates, Adam and Ng, Andrew and Lee, Honglak},
  booktitle={AISTATS},
  year={2011},
  note = {\url{https://cs.stanford.edu/~acoates/papers/coatesleeng_aistats_2011.pdf} },
}