gatito

Kitti contiene un conjunto de tareas de visión creadas con una plataforma de conducción autónoma. El punto de referencia completo contiene muchas tareas, como estéreo, flujo óptico, odometría visual, etc. Este conjunto de datos contiene el conjunto de datos de detección de objetos, incluidas las imágenes monoculares y los cuadros delimitadores. El conjunto de datos contiene 7481 imágenes de entrenamiento anotadas con cuadros delimitadores 3D. Puede encontrar una descripción completa de las anotaciones en el archivo Léame del kit de desarrollo de objetos en la página de inicio de Kitti.

Separar Ejemplos
'test' 711
'train' 6,347
'validation' 423
  • Estructura de características :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/file_name': Text(shape=(), dtype=string),
    'objects': Sequence({
        'alpha': float32,
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'dimensions': Tensor(shape=(3,), dtype=float32),
        'location': Tensor(shape=(3,), dtype=float32),
        'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
        'rotation_y': float32,
        'truncated': float32,
        'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
imagen Imagen (Ninguno, Ninguno, 3) uint8
imagen/nombre_de_archivo Texto cuerda
objetos Secuencia
objetos/alfa Tensor flotar32 Ángulo de observación del objeto, rango [-pi..pi]
objetos/bbox BBoxCaracterística (4,) flotar32 Cuadro delimitador 2D de objeto en la imagen
objetos/dimensiones Tensor (3,) flotar32 Dimensiones del objeto 3D: alto, ancho, largo (en metros)
objetos/ubicación Tensor (3,) flotar32 Ubicación de objetos 3D x,y,z en coordenadas de cámara (en metros)
objetos/ocluidos Etiqueta de clase int64 Número entero (0,1,2,3) que indica el estado de oclusión: 0 = totalmente visible, 1 = parcialmente ocluido 2 = en gran parte ocluido, 3 = desconocido
objetos/rotación_y Tensor flotar32 Rotación ry alrededor del eje Y en coordenadas de cámara [-pi..pi]
objetos/truncado Tensor flotar32 Flotante de 0 (no truncado) a 1 (truncado), donde truncado se refiere al objeto que sale de los límites de la imagen
objetos/tipo Etiqueta de clase int64 El tipo de objeto, por ejemplo, 'Coche' o 'Van'

Visualización

  • Cita :
@inproceedings{Geiger2012CVPR,
  author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
  title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
  booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
  year = {2012}
}