smallnorb

Esta base de dados destina-se a experimentos de reconhecimento de objetos 3D a partir da forma. Contém imagens de 50 brinquedos pertencentes a 5 categorias genéricas: animais de quatro patas, figuras humanas, aviões, caminhões e carros. Os objetos foram fotografados por duas câmeras em 6 condições de iluminação, 9 elevações (30 a 70 graus a cada 5 graus) e 18 azimutes (0 a 340 a cada 20 graus).

O conjunto de treinamento é composto por 5 instâncias de cada categoria (instâncias 4, 6, 7, 8 e 9) e o conjunto de teste pelas 5 instâncias restantes (instâncias 0, 1, 2, 3 e 5).

Dividir Exemplos
'test' 24.300
'train' 24.300
  • Estrutura de recursos :
FeaturesDict({
    'image': Image(shape=(96, 96, 1), dtype=uint8),
    'image2': Image(shape=(96, 96, 1), dtype=uint8),
    'instance': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_azimuth': ClassLabel(shape=(), dtype=int64, num_classes=18),
    'label_category': ClassLabel(shape=(), dtype=int64, num_classes=5),
    'label_elevation': ClassLabel(shape=(), dtype=int64, num_classes=9),
    'label_lighting': ClassLabel(shape=(), dtype=int64, num_classes=6),
})
  • Documentação do recurso:
Funcionalidade Aula Forma Tipo D Descrição
RecursosDict
imagem Imagem (96, 96, 1) uint8
imagem2 Imagem (96, 96, 1) uint8
instância ClassLabel int64
label_azimute ClassLabel int64
label_category ClassLabel int64
label_elevation ClassLabel int64
label_lighting ClassLabel int64
  • Citação :
@article{LeCun2004LearningMF,
  title={Learning methods for generic object recognition with invariance to pose and lighting},
  author={Yann LeCun and Fu Jie Huang and L{\'e}on Bottou},
  journal={Proceedings of the 2004 IEEE Computer Society Conference on Computer Vision and Pattern Recognition},
  year={2004},
  volume={2},
  pages={II-104 Vol.2}
}