kitti

Kitti chứa một bộ các nhiệm vụ tầm nhìn được xây dựng bằng cách sử dụng nền tảng lái xe tự động. Điểm chuẩn đầy đủ chứa nhiều tác vụ như âm thanh nổi, luồng quang học, đo mùi trực quan, v.v. Tập dữ liệu này chứa tập dữ liệu phát hiện đối tượng, bao gồm hình ảnh một mắt và hộp giới hạn. Tập dữ liệu chứa 7481 hình ảnh đào tạo được chú thích bằng các hộp giới hạn 3D. Bạn có thể tìm thấy mô tả đầy đủ về các chú thích trong readme của readme bộ công cụ phát triển đối tượng trên trang chủ Kitti.

Tách ra Các ví dụ
'test' 711
'train' 6,347
'validation' 423
  • Các tính năng:
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'image/file_name': Text(shape=(), dtype=tf.string),
    'objects': Sequence({
        'alpha': tf.float32,
        'bbox': BBoxFeature(shape=(4,), dtype=tf.float32),
        'dimensions': Tensor(shape=(3,), dtype=tf.float32),
        'location': Tensor(shape=(3,), dtype=tf.float32),
        'occluded': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
        'rotation_y': tf.float32,
        'truncated': tf.float32,
        'type': ClassLabel(shape=(), dtype=tf.int64, num_classes=8),
    }),
})

Hình dung

  • Trích dẫn:
@inproceedings{Geiger2012CVPR,
  author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
  title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
  booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
  year = {2012}
}