smallnorb

Cơ sở dữ liệu này dành cho các thử nghiệm nhận dạng đối tượng 3D từ hình dạng. Nó chứa hình ảnh của 50 đồ chơi thuộc 5 loại chung: động vật bốn chân, hình người, máy bay, xe tải và ô tô. Các vật thể được chụp bởi hai camera trong 6 điều kiện ánh sáng, 9 độ cao (30 đến 70 độ cứ sau 5 độ) và 18 góc phương vị (0 đến 340 cứ sau 20 độ).

Tập huấn luyện bao gồm 5 trường hợp của mỗi loại (các trường hợp 4, 6, 7, 8 và 9) và tập kiểm tra của 5 trường hợp còn lại (các trường hợp 0, 1, 2, 3 và 5).

Tách ra ví dụ
'test' 24.300
'train' 24.300
  • Cấu trúc tính năng :
FeaturesDict({
    'image': Image(shape=(96, 96, 1), dtype=uint8),
    'image2': Image(shape=(96, 96, 1), dtype=uint8),
    'instance': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_azimuth': ClassLabel(shape=(), dtype=int64, num_classes=18),
    'label_category': ClassLabel(shape=(), dtype=int64, num_classes=5),
    'label_elevation': ClassLabel(shape=(), dtype=int64, num_classes=9),
    'label_lighting': ClassLabel(shape=(), dtype=int64, num_classes=6),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự miêu tả
Tính năngDict
hình ảnh Hình ảnh (96, 96, 1) uint8
hình ảnh2 Hình ảnh (96, 96, 1) uint8
ví dụ LớpNhãn int64
nhãn_phương vị LớpNhãn int64
nhãn_category LớpNhãn int64
nhãn_độ cao LớpNhãn int64
nhãn_ánh sáng LớpNhãn int64
  • trích dẫn :
@article{LeCun2004LearningMF,
  title={Learning methods for generic object recognition with invariance to pose and lighting},
  author={Yann LeCun and Fu Jie Huang and L{\'e}on Bottou},
  journal={Proceedings of the 2004 IEEE Computer Society Conference on Computer Vision and Pattern Recognition},
  year={2004},
  volume={2},
  pages={II-104 Vol.2}
}