chaton

Kitti contient une suite de tâches de vision construites à l'aide d'une plate-forme de conduite autonome. Le benchmark complet contient de nombreuses tâches telles que la stéréo, le flux optique, l'odométrie visuelle, etc. Cet ensemble de données contient l'ensemble de données de détection d'objets, y compris les images monoculaires et les cadres de délimitation. L'ensemble de données contient 7481 images d'entraînement annotées avec des cadres de délimitation 3D. Une description complète des annotations peut être trouvée dans le fichier readme du kit de développement d'objets readme sur la page d'accueil de Kitti.

Diviser Exemples
'test' 711
'train' 6 347
'validation' 423
  • Caractéristiques:
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'image/file_name': Text(shape=(), dtype=tf.string),
    'objects': Sequence({
        'alpha': tf.float32,
        'bbox': BBoxFeature(shape=(4,), dtype=tf.float32),
        'dimensions': Tensor(shape=(3,), dtype=tf.float32),
        'location': Tensor(shape=(3,), dtype=tf.float32),
        'occluded': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
        'rotation_y': tf.float32,
        'truncated': tf.float32,
        'type': ClassLabel(shape=(), dtype=tf.int64, num_classes=8),
    }),
})

Visualisation

  • citation:
@inproceedings{Geiger2012CVPR,
  author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
  title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
  booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
  year = {2012}
}