gattino

Kitti contiene una suite di attività di visione costruite utilizzando una piattaforma di guida autonoma. Il benchmark completo contiene molte attività come stereo, flusso ottico, odometria visiva, ecc. Questo set di dati contiene il set di dati di rilevamento degli oggetti, comprese le immagini monoculare e i riquadri di delimitazione. Il set di dati contiene 7481 immagini di addestramento annotate con riquadri di delimitazione 3D. Una descrizione completa delle annotazioni può essere trovata nel readme del readme del kit di sviluppo dell'oggetto sulla homepage di Kitti.

Diviso Esempi
'test' 711
'train' 6.347
'validation' 423
  • Caratteristiche:
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'image/file_name': Text(shape=(), dtype=tf.string),
    'objects': Sequence({
        'alpha': tf.float32,
        'bbox': BBoxFeature(shape=(4,), dtype=tf.float32),
        'dimensions': Tensor(shape=(3,), dtype=tf.float32),
        'location': Tensor(shape=(3,), dtype=tf.float32),
        'occluded': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
        'rotation_y': tf.float32,
        'truncated': tf.float32,
        'type': ClassLabel(shape=(), dtype=tf.int64, num_classes=8),
    }),
})

Visualizzazione

  • citazione:
@inproceedings{Geiger2012CVPR,
  author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
  title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
  booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
  year = {2012}
}