chaton

Kitti contient une suite de tâches de vision construites à l'aide d'une plateforme de conduite autonome. Le benchmark complet contient de nombreuses tâches telles que la stéréo, le flux optique, l'odométrie visuelle, etc. Cet ensemble de données contient l'ensemble de données de détection d'objets, y compris les images monoculaires et les boîtes englobantes. L'ensemble de données contient 7481 images d'entraînement annotées avec des boîtes englobantes 3D. Une description complète des annotations peut être trouvée dans le fichier readme du kit de développement d'objet readme sur la page d'accueil de Kitti.

Diviser Exemples
'test' 711
'train' 6 347
'validation' 423
  • Structure des fonctionnalités :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/file_name': Text(shape=(), dtype=string),
    'objects': Sequence({
        'alpha': float32,
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'dimensions': Tensor(shape=(3,), dtype=float32),
        'location': Tensor(shape=(3,), dtype=float32),
        'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
        'rotation_y': float32,
        'truncated': float32,
        'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
image Image (Aucun, Aucun, 3) uint8
image/nom_fichier Texte chaîne de caractères
objets Séquence
objets/alpha Tenseur float32 Angle d'observation de l'objet, allant de [-pi..pi]
objets/bbox BBoxFeature (4,) float32 Boîte englobante 2D de l'objet dans l'image
objets/dimensions Tenseur (3,) float32 Dimensions de l'objet 3D : hauteur, largeur, longueur (en mètres)
objets/lieu Tenseur (3,) float32 Emplacement de l'objet 3D x, y, z dans les coordonnées de la caméra (en mètres)
objets/occlus Étiquette de classe int64 Entier (0,1,2,3) indiquant l'état d'occlusion : 0 = entièrement visible, 1 = partiellement occlus 2 = largement occlus, 3 = inconnu
objets/rotation_y Tenseur float32 Rotation ry autour de l'axe Y dans les coordonnées de la caméra [-pi..pi]
objets/tronqués Tenseur float32 Flotter de 0 (non tronqué) à 1 (tronqué), où tronqué fait référence à l'objet quittant les limites de l'image
objets/type Étiquette de classe int64 Le type d'objet, par exemple 'Voiture' ou 'Van'

Visualisation

  • Citation :
@inproceedings{Geiger2012CVPR,
  author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
  title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
  booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
  year = {2012}
}