petitnorb


Cette base de données est destinée aux expériences de reconnaissance d'objets 3D à partir de la forme. Il contient des images de 50 jouets appartenant à 5 catégories génériques : animaux à quatre pattes, figures humaines, avions, camions et voitures. Les objets ont été imagés par deux caméras dans 6 conditions d'éclairage, 9 élévations (30 à 70 degrés tous les 5 degrés) et 18 azimuts (0 à 340 tous les 20 degrés).

L'ensemble d'apprentissage est composé de 5 instances de chaque catégorie (instances 4, 6, 7, 8 et 9) et l'ensemble de test des 5 instances restantes (instances 0, 1, 2, 3 et 5).

Diviser Exemples
'test' 24 300
'train' 24 300
  • Caractéristiques:
FeaturesDict({
    'image': Image(shape=(96, 96, 1), dtype=tf.uint8),
    'image2': Image(shape=(96, 96, 1), dtype=tf.uint8),
    'instance': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
    'label_azimuth': ClassLabel(shape=(), dtype=tf.int64, num_classes=18),
    'label_category': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
    'label_elevation': ClassLabel(shape=(), dtype=tf.int64, num_classes=9),
    'label_lighting': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
})
  • citation:
\
@article{LeCun2004LearningMF,
  title={Learning methods for generic object recognition with invariance to pose and lighting},
  author={Yann LeCun and Fu Jie Huang and L{\'e}on Bottou},
  journal={Proceedings of the 2004 IEEE Computer Society Conference on Computer Vision and Pattern Recognition},
  year={2004},
  volume={2},
  pages={II-104 Vol.2}
}