stl10

  • Descrição :

O conjunto de dados STL-10 é um conjunto de dados de reconhecimento de imagem para o desenvolvimento de aprendizado de recursos não supervisionado, aprendizado profundo e algoritmos de aprendizado autodidata. É inspirado no conjunto de dados CIFAR-10, mas com algumas modificações. Em particular, cada classe tem menos exemplos de treinamento rotulados do que no CIFAR-10, mas um conjunto muito grande de exemplos não rotulados é fornecido para aprender modelos de imagem antes do treinamento supervisionado. O principal desafio é fazer uso dos dados não rotulados (que vêm de uma distribuição semelhante, mas diferente dos dados rotulados) para construir uma prévia útil. Todas as imagens foram adquiridas de exemplos rotulados no ImageNet.

Dividir Exemplos
'test' 8.000
'train' 5.000
'unlabelled' 100.000
  • Estrutura de recursos :
FeaturesDict({
    'image': Image(shape=(96, 96, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • Documentação do recurso:
Característica Classe Forma Tipo D Descrição
RecursosDict
imagem Imagem (96, 96, 3) uint8
rótulo ClassLabel int64

Visualização

  • Citação :
@inproceedings{coates2011stl10,
  title={ {An Analysis of Single Layer Networks in Unsupervised Feature Learning} },
  author={Coates, Adam and Ng, Andrew and Lee, Honglak},
  booktitle={AISTATS},
  year={2011},
  note = {\url{https://cs.stanford.edu/~acoates/papers/coatesleeng_aistats_2011.pdf} },
}