Conozca lo último en aprendizaje automático, IA generativa y más en el Simposio WiML 2023.

Se usó la API de Cloud Translation para traducir esta página.

gatito

Visualización : Explore en Know Your Data
Descripción :

Kitti contiene un conjunto de tareas de visión creadas con una plataforma de conducción autónoma. El punto de referencia completo contiene muchas tareas, como estéreo, flujo óptico, odometría visual, etc. Este conjunto de datos contiene el conjunto de datos de detección de objetos, incluidas las imágenes monoculares y los cuadros delimitadores. El conjunto de datos contiene 7481 imágenes de entrenamiento anotadas con cuadros delimitadores 3D. Puede encontrar una descripción completa de las anotaciones en el archivo Léame del kit de desarrollo de objetos en la página de inicio de Kitti.

Documentación adicional : Explore en Papers With Code
Página de inicio : http://www.cvlibs.net/datasets/kitti/
Código fuente : tfds.datasets.kitti.Builder
Versiones :
- 3.1.0 : Sin notas de la versión.
- 3.2.0 : Kit de desarrollo actualizado.
- 3.3.0 (predeterminado): Se agregaron etiquetas para la función occluded .
Tamaño de descarga : 11.71 GiB
Tamaño del conjunto de datos : 5.27 GiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :

Separar	Ejemplos
`'test'`	711
`'train'`	6,347
`'validation'`	423

Estructura de características :

FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/file_name': Text(shape=(), dtype=string),
    'objects': Sequence({
        'alpha': float32,
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'dimensions': Tensor(shape=(3,), dtype=float32),
        'location': Tensor(shape=(3,), dtype=float32),
        'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
        'rotation_y': float32,
        'truncated': float32,
        'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D	Descripción
	CaracterísticasDict
imagen	Imagen	(Ninguno, Ninguno, 3)	uint8
imagen/nombre_de_archivo	Texto		cuerda
objetos	Secuencia
objetos/alfa	Tensor		flotar32	Ángulo de observación del objeto, rango [-pi..pi]
objetos/bbox	BBoxCaracterística	(4,)	flotar32	Cuadro delimitador 2D de objeto en la imagen
objetos/dimensiones	Tensor	(3,)	flotar32	Dimensiones del objeto 3D: alto, ancho, largo (en metros)
objetos/ubicación	Tensor	(3,)	flotar32	Ubicación de objetos 3D x,y,z en coordenadas de cámara (en metros)
objetos/ocluidos	Etiqueta de clase		int64	Número entero (0,1,2,3) que indica el estado de oclusión: 0 = totalmente visible, 1 = parcialmente ocluido 2 = en gran parte ocluido, 3 = desconocido
objetos/rotación_y	Tensor		flotar32	Rotación ry alrededor del eje Y en coordenadas de cámara [-pi..pi]
objetos/truncado	Tensor		flotar32	Flotante de 0 (no truncado) a 1 (truncado), donde truncado se refiere al objeto que sale de los límites de la imagen
objetos/tipo	Etiqueta de clase		int64	El tipo de objeto, por ejemplo, 'Coche' o 'Van'

Claves supervisadas (Ver as_supervised doc ): None
Figura ( tfds.show_examples ):

Visualización

Ejemplos ( tfds.as_dataframe ):

Cita :

@inproceedings{Geiger2012CVPR,
  author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
  title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
  booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
  year = {2012}
}

gatito Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

gatito