¡TFDS ahora admite el formato Croissant 🥐 ! Lea la documentación para saber más.

Se usó la API de Cloud Translation para traducir esta página.

paisajes urbanos

Descripción :

Cityscapes es un conjunto de datos que consta de diversas escenas de calles urbanas en 50 ciudades diferentes en distintas épocas del año, así como verdades básicas para varias tareas de visión, incluida la segmentación semántica, la segmentación a nivel de instancia (TODO) y la inferencia de disparidad de pares estéreo.

Para las tareas de segmentación (división predeterminada, accesible a través de 'cityscapes/semantic_segmentation'), Cityscapes proporciona anotaciones densas a nivel de píxeles para 5000 imágenes con una resolución de 1024 * 2048 dividida previamente en conjuntos de entrenamiento (2975), validación (500) y prueba (1525). Las anotaciones de etiquetas para las tareas de segmentación abarcan más de 30 clases que se encuentran comúnmente durante la percepción de la escena de conducción. La información detallada de la etiqueta se puede encontrar aquí: https://github.com/mcordts/cityscapesScripts/blob/master/cityscapesscripts/helpers/labels.py#L52-L99

Cityscapes también proporciona anotaciones de segmentación de grano grueso (accesibles a través de 'cityscapes/semantic_segmentation_extra') para imágenes de 19998 en una división 'train_extra' que puede resultar útil para modelos de preentrenamiento/con gran cantidad de datos.

Además de la segmentación, los paisajes urbanos también proporcionan pares de imágenes estéreo y verdades básicas para tareas de inferencia de disparidad en las divisiones normal y extra (accesibles a través de 'cityscapes/stereo_disparity' y 'cityscapes/stereo_disparity_extra' respectivamente).

Ejemplos engordados:

Para 'paisajes urbanos/stereo_disparity_extra':
- troisdorf_000000 000073 {*} imágenes (sin mapa de disparidad presente)

Documentación adicional : Explore en Papers With Code
Página de inicio: https://www.cityscapes-dataset.com
Código fuente : tfds.datasets.cityscapes.Builder
Versiones :
- 1.0.0 (predeterminado): Sin notas de la versión.
Tamaño de descarga : Unknown size
Instrucciones de descarga manual : este conjunto de datos requiere que descargue los datos de origen manualmente en download_config.manual_dir (el valor predeterminado es ~/tensorflow_datasets/downloads/manual/ ):
Tienes que descargar archivos de https://www.cityscapes-dataset.com/login/ (Este conjunto de datos requiere registro). Para la configuración básica (semantic_segmentation) debe descargar 'leftImg8bit_trainvaltest.zip' y 'gtFine_trainvaltest.zip'. Otras configuraciones requieren archivos adicionales; consulte el código para obtener más detalles.
Almacenamiento automático en caché ( documentación ): No
Claves supervisadas (Ver as_supervised doc ): None
Figura ( tfds.show_examples ): no compatible.
Cita :

@inproceedings{Cordts2016Cityscapes,
  title={The Cityscapes Dataset for Semantic Urban Scene Understanding},
  author={Cordts, Marius and Omran, Mohamed and Ramos, Sebastian and Rehfeld, Timo and Enzweiler, Markus and Benenson, Rodrigo and Franke, Uwe and Roth, Stefan and Schiele, Bernt},
  booktitle={Proc. of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2016}
}

paisajes urbanos/segmentación_semántica (configuración predeterminada)

Descripción de la configuración : conjunto de datos de segmentación semántica de paisajes urbanos.
Tamaño del conjunto de datos : 10.86 GiB
Divisiones :

Separar	Ejemplos
`'test'`	1,525
`'train'`	2,975
`'validation'`	500

Estructura de características :

FeaturesDict({
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
id_imagen	Texto		cuerda
imagen_izquierda	Imagen	(1024, 2048, 3)	uint8
etiqueta_segmentación	Imagen	(1024, 2048, 1)	uint8

Ejemplos ( tfds.as_dataframe ):

paisajes urbanos/semantic_segmentation_extra

Descripción de la configuración : conjunto de datos de segmentación semántica de paisajes urbanos con etiquetas gruesas y divididas train_extra.
Tamaño del conjunto de datos : 51.92 GiB
Divisiones :

Separar	Ejemplos
`'train'`	2,975
`'train_extra'`	19,998
`'validation'`	500

Estructura de características :

FeaturesDict({
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'segmentation_label': Image(shape=(1024, 2048, 1), dtype=uint8),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
id_imagen	Texto		cuerda
imagen_izquierda	Imagen	(1024, 2048, 3)	uint8
etiqueta_segmentación	Imagen	(1024, 2048, 1)	uint8

Ejemplos ( tfds.as_dataframe ):

paisajes urbanos/stereo_disparity

Descripción de la configuración : imagen estéreo de paisajes urbanos y conjunto de datos de mapas de disparidad.
Tamaño del conjunto de datos : 25.03 GiB
Divisiones :

Separar	Ejemplos
`'test'`	1,525
`'train'`	2,975
`'validation'`	500

Estructura de características :

FeaturesDict({
    'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
disparity_map	Imagen	(1024, 2048, 1)	uint8
id_imagen	Texto		cuerda
imagen_izquierda	Imagen	(1024, 2048, 3)	uint8
imagen_derecha	Imagen	(1024, 2048, 3)	uint8

Ejemplos ( tfds.as_dataframe ):

paisajes urbanos/stereo_disparity_extra

Descripción de la configuración : imagen estéreo de paisajes urbanos y conjunto de datos de mapas de disparidad con división train_extra.
Tamaño del conjunto de datos : 119.18 GiB
Divisiones :

Separar	Ejemplos
`'train'`	2,975
`'train_extra'`	19,997
`'validation'`	500

Estructura de características :

FeaturesDict({
    'disparity_map': Image(shape=(1024, 2048, 1), dtype=uint8),
    'image_id': Text(shape=(), dtype=string),
    'image_left': Image(shape=(1024, 2048, 3), dtype=uint8),
    'image_right': Image(shape=(1024, 2048, 3), dtype=uint8),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
disparity_map	Imagen	(1024, 2048, 1)	uint8
id_imagen	Texto		cuerda
imagen_izquierda	Imagen	(1024, 2048, 3)	uint8
imagen_derecha	Imagen	(1024, 2048, 3)	uint8

Ejemplos ( tfds.as_dataframe ):