Kätzchen

Kitti enthält eine Reihe von Vision-Aufgaben, die mit einer autonomen Fahrplattform erstellt wurden. Der vollständige Benchmark enthält viele Aufgaben wie Stereo, optischer Fluss, visuelle Odometrie usw. Dieser Datensatz enthält den Objekterkennungsdatensatz, einschließlich der monokularen Bilder und Begrenzungsrahmen. Der Datensatz enthält 7481 Trainingsbilder, die mit 3D-Begrenzungsboxen annotiert sind. Eine vollständige Beschreibung der Anmerkungen finden Sie in der Readme-Datei des Object Development Kit-Readme auf der Kitti-Homepage.

Teilt Beispiele
'test' 711
'train' 6.347
'validation' 423
  • Eigenschaften:
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'image/file_name': Text(shape=(), dtype=tf.string),
    'objects': Sequence({
        'alpha': tf.float32,
        'bbox': BBoxFeature(shape=(4,), dtype=tf.float32),
        'dimensions': Tensor(shape=(3,), dtype=tf.float32),
        'location': Tensor(shape=(3,), dtype=tf.float32),
        'occluded': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
        'rotation_y': tf.float32,
        'truncated': tf.float32,
        'type': ClassLabel(shape=(), dtype=tf.int64, num_classes=8),
    }),
})

Visualisierung

  • Zitat:
@inproceedings{Geiger2012CVPR,
  author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
  title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
  booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
  year = {2012}
}