Conozca lo último en aprendizaje automático, IA generativa y más en el Simposio WiML 2023.

Se usó la API de Cloud Translation para traducir esta página.

imagenet2012_subconjunto

Visualización : Explore en Know Your Data
Descripción :

Imagenet2012Subset es un subconjunto del conjunto de datos original de ImageNet ILSVRC 2012. El conjunto de datos comparte el mismo conjunto de validación que el conjunto de datos original de ImageNet ILSVRC 2012. Sin embargo, el conjunto de entrenamiento se submuestrea de forma equilibrada por etiquetas. En la configuración 1pct , se muestrean imágenes del 1% o 12811, la mayoría de las clases tienen el mismo número de imágenes (promedio de 12,8), algunas clases tienen aleatoriamente 1 ejemplo más que otras; y en la configuración 10pct , ~10% o 128116, la mayoría de las clases tienen la misma cantidad de imágenes (promedio de 128), y algunas clases tienen aleatoriamente 1 ejemplo más que otras.

Se supone que esto se usa como punto de referencia para el aprendizaje semisupervisado y se usó originalmente en el documento SimCLR ( https://arxiv.org/abs/2002.05709 ).

Página de inicio : http://image-net.org/
Código fuente : tfds.datasets.imagenet2012_subset.Builder
Versiones :
- 2.0.0 : Corregir etiquetas de validación.
- 2.0.1 : Corrección de codificación. Sin cambios desde el punto de vista del usuario.
- 3.0.0 : corrige la coloración en ~12 imágenes (CMYK -> RGB). Corrija el formato para mantener la coherencia (convierta la imagen png única a Jpeg). Lectura de generación más rápida directamente desde el archivo.
- 4.0.0 : (inédito)
- 5.0.0 (predeterminado): nueva API dividida ( https://tensorflow.org/datasets/splits )
- 5.1.0 : división de prueba agregada.
Instrucciones de descarga manual : este conjunto de datos requiere que descargue los datos de origen manualmente en download_config.manual_dir (el valor predeterminado es ~/tensorflow_datasets/downloads/manual/ ):
manual_dir debe contener dos archivos: ILSVRC2012_img_train.tar e ILSVRC2012_img_val.tar. Debe registrarse en https://image-net.org/download-images para obtener el enlace para descargar el conjunto de datos.
Almacenamiento automático en caché ( documentación ): No
Estructura de características :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
Nombre del archivo	Texto		cuerda
imagen	Imagen	(Ninguno, Ninguno, 3)	uint8
etiqueta	Etiqueta de clase		int64

Claves supervisadas (Ver como_documento as_supervised ): ('image', 'label')
Cita :

@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset/1pct (configuración predeterminada)

Descripción de la configuración : 1 por ciento del conjunto total de entrenamiento de ImageNet.
Tamaño de la descarga : 254.22 KiB
Tamaño del conjunto de datos : 7.61 GiB
Divisiones :

Separar	Ejemplos
`'train'`	12,811
`'validation'`	50,000

Figura ( tfds.show_examples ):

Visualización

Ejemplos ( tfds.as_dataframe ):