Visualisation : Explorer dans Know Your Data
Descriptif :
Kitti contient une suite de tâches de vision construites à l'aide d'une plateforme de conduite autonome. Le benchmark complet contient de nombreuses tâches telles que la stéréo, le flux optique, l'odométrie visuelle, etc. Cet ensemble de données contient l'ensemble de données de détection d'objets, y compris les images monoculaires et les boîtes englobantes. L'ensemble de données contient 7481 images d'entraînement annotées avec des boîtes englobantes 3D. Une description complète des annotations peut être trouvée dans le fichier readme du kit de développement d'objet readme sur la page d'accueil de Kitti.
Documentation complémentaire : Explorer sur Papers With Code
Page d'accueil : http://www.cvlibs.net/datasets/kitti/
Code source :
tfds.datasets.kitti.Builder
Versions :
-
3.1.0
: Aucune note de version. -
3.2.0
: Devkit mis à jour. -
3.3.0
(par défaut) : étiquettes ajoutées pour la fonctionoccluded
.
-
Taille du téléchargement :
11.71 GiB
Taille du jeu de données :
5.27 GiB
Mise en cache automatique ( documentation ): Non
Fractionnements :
Diviser | Exemples |
---|---|
'test' | 711 |
'train' | 6 347 |
'validation' | 423 |
- Structure des fonctionnalités :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/file_name': Text(shape=(), dtype=string),
'objects': Sequence({
'alpha': float32,
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'dimensions': Tensor(shape=(3,), dtype=float32),
'location': Tensor(shape=(3,), dtype=float32),
'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
'rotation_y': float32,
'truncated': float32,
'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
image | Image | (Aucun, Aucun, 3) | uint8 | |
image/nom_fichier | Texte | chaîne de caractères | ||
objets | Séquence | |||
objets/alpha | Tenseur | float32 | Angle d'observation de l'objet, allant de [-pi..pi] | |
objets/bbox | BBoxFeature | (4,) | float32 | Boîte englobante 2D de l'objet dans l'image |
objets/dimensions | Tenseur | (3,) | float32 | Dimensions de l'objet 3D : hauteur, largeur, longueur (en mètres) |
objets/lieu | Tenseur | (3,) | float32 | Emplacement de l'objet 3D x, y, z dans les coordonnées de la caméra (en mètres) |
objets/occlus | Étiquette de classe | int64 | Entier (0,1,2,3) indiquant l'état d'occlusion : 0 = entièrement visible, 1 = partiellement occlus 2 = largement occlus, 3 = inconnu | |
objets/rotation_y | Tenseur | float32 | Rotation ry autour de l'axe Y dans les coordonnées de la caméra [-pi..pi] | |
objets/tronqués | Tenseur | float32 | Flotter de 0 (non tronqué) à 1 (tronqué), où tronqué fait référence à l'objet quittant les limites de l'image | |
objets/type | Étiquette de classe | int64 | Le type d'objet, par exemple 'Voiture' ou 'Van' |
Clés supervisées (Voir
as_supervised
doc ):None
Figure ( tfds.show_examples ):
- Exemples ( tfds.as_dataframe ):
- Citation :
@inproceedings{Geiger2012CVPR,
author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
year = {2012}
}