Questa pagina è stata tradotta dall'API Cloud Translation.
Switch to English

smallnorb

  • Descrizione :


Questo database è destinato a esperimenti nel riconoscimento di oggetti 3D dalla forma. Contiene immagini di 50 giocattoli appartenenti a 5 categorie generiche: animali a quattro zampe, figure umane, aeroplani, camion e automobili. Gli oggetti sono stati ripresi da due telecamere in 6 condizioni di illuminazione, 9 elevazioni (da 30 a 70 gradi ogni 5 gradi) e 18 azimut (da 0 a 340 ogni 20 gradi).

Il set di training è composto da 5 istanze di ciascuna categoria (istanze 4, 6, 7, 8 e 9) e il set di test delle restanti 5 istanze (istanze 0, 1, 2, 3 e 5).

Diviso Esempi
'test' 24,300
'train' 24,300
  • Caratteristiche :
 FeaturesDict({
    'image': Image(shape=(96, 96, 1), dtype=tf.uint8),
    'image2': Image(shape=(96, 96, 1), dtype=tf.uint8),
    'instance': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
    'label_azimuth': ClassLabel(shape=(), dtype=tf.int64, num_classes=18),
    'label_category': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
    'label_elevation': ClassLabel(shape=(), dtype=tf.int64, num_classes=9),
    'label_lighting': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
})
 
  • Chiavi supervisionate (vedi as_supervised doc ): ('image', 'label_category')

  • Citazione :

 \
@article{LeCun2004LearningMF,
  title={Learning methods for generic object recognition with invariance to pose and lighting},
  author={Yann LeCun and Fu Jie Huang and L{\'e}on Bottou},
  journal={Proceedings of the 2004 IEEE Computer Society Conference on Computer Vision and Pattern Recognition},
  year={2004},
  volume={2},
  pages={II-104 Vol.2}
}