キティ

Kittiには、自動運転プラットフォームを使用して構築された一連のビジョンタスクが含まれています。完全なベンチマークには、ステレオ、オプティカルフロー、視覚オドメトリなどの多くのタスクが含まれています。このデータセットには、単眼画像やバウンディングボックスなどのオブジェクト検出データセットが含まれています。データセットには、3Dバウンディングボックスで注釈が付けられた7481個のトレーニング画像が含まれています。アノテーションの完全な説明は、Kittiホームページのオブジェクト開発キットreadmeのreadmeにあります。

スプリット
'test' 711
'train' 6,347
'validation' 423
  • 特長
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'image/file_name': Text(shape=(), dtype=tf.string),
    'objects': Sequence({
        'alpha': tf.float32,
        'bbox': BBoxFeature(shape=(4,), dtype=tf.float32),
        'dimensions': Tensor(shape=(3,), dtype=tf.float32),
        'location': Tensor(shape=(3,), dtype=tf.float32),
        'occluded': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
        'rotation_y': tf.float32,
        'truncated': tf.float32,
        'type': ClassLabel(shape=(), dtype=tf.int64, num_classes=8),
    }),
})

視覚化

  • 引用
@inproceedings{Geiger2012CVPR,
  author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
  title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
  booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
  year = {2012}
}