smallnorb


このデータベースは、形状からの3Dオブジェクト認識の実験を目的としています。 4本足の動物、人物、飛行機、トラック、車の5つの一般的なカテゴリに属する​​50のおもちゃの画像が含まれています。オブジェクトは、6つの照明条件、9つの仰角(5度ごとに30〜70度)、および18の方位角(20度ごとに0〜340)で2台のカメラによって画像化されました。

トレーニングセットは、各カテゴリの5つのインスタンス(インスタンス4、6、7、8、および9)と、残りの5つのインスタンス(インスタンス0、1、2、3、および5)のテストセットで構成されます。

スプリット
'test' 24,300
'train' 24,300
  • 特長
FeaturesDict({
    'image': Image(shape=(96, 96, 1), dtype=tf.uint8),
    'image2': Image(shape=(96, 96, 1), dtype=tf.uint8),
    'instance': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
    'label_azimuth': ClassLabel(shape=(), dtype=tf.int64, num_classes=18),
    'label_category': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
    'label_elevation': ClassLabel(shape=(), dtype=tf.int64, num_classes=9),
    'label_lighting': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
})
  • 引用
\
@article{LeCun2004LearningMF,
  title={Learning methods for generic object recognition with invariance to pose and lighting},
  author={Yann LeCun and Fu Jie Huang and L{\'e}on Bottou},
  journal={Proceedings of the 2004 IEEE Computer Society Conference on Computer Vision and Pattern Recognition},
  year={2004},
  volume={2},
  pages={II-104 Vol.2}
}