¡El Día de la Comunidad de ML es el 9 de noviembre! Únase a nosotros para recibir actualizaciones de TensorFlow, JAX, y más Más información

imagenet2012_subset

Imagenet2012Subset es un subconjunto del conjunto de datos original ImageNet ILSVRC 2012. La cuota de conjunto de datos al mismo conjunto de validación que el original IMAGEnet ILSVRC 2012 conjunto de datos. Sin embargo, el conjunto de entrenamiento se submuestrea de forma equilibrada en las etiquetas. En 1pct configuración, 1%, o 12.811, las imágenes se tomaron muestras, la mayoría de las clases tienen el mismo número de imágenes (promedio 12,8), algunas clases tienen azar 1 ejemplo más que otros; y en 10pct configuración, ~ 10%, o 128 116, la mayoría de las clases tienen el mismo número de imágenes (promedio 128), y algunas clases tienen azar 1 ejemplo más que otros.

Esto se supone para ser utilizado como un punto de referencia para el aprendizaje semi-supervisado, y se ha utilizado originalmente en papel SimCLR ( https://arxiv.org/abs/2002.05709 ).

  • Inicio: http://image-net.org/

  • El código fuente: tfds.image_classification.Imagenet2012Subset

  • versiones:

    • 2.0.0 etiquetas de validación Fix:.
    • 2.0.1 : La codificación de corrección. Sin cambios desde el punto de vista del usuario.
    • 3.0.0 : coloración Fix en ~ 12 imágenes (CMYK -> RGB). Corrija el formato para mantener la coherencia (convierta la imagen png única a Jpeg). Lectura de generación más rápida directamente desde el archivo.

    • 4.0.0 : (no publicado)

    • 5.0.0 (por defecto): Nueva API de división ( https://tensorflow.org/datasets/splits )

    • 5.1.0 : Añadido prueba dividida.

  • Las instrucciones de descarga manual: Este conjunto de datos se requiere para descargar los datos de origen manualmente en download_config.manual_dir (por defecto ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir debe contener dos archivos: ILSVRC2012_img_train.tar e ILSVRC2012_img_val.tar. Es necesario registrarse en http://www.image-net.org/download-images con el fin de obtener el enlace para descargar el conjunto de datos.

  • Auto-caché ( documentación ): No

  • características:

FeaturesDict({
    'file_name': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=1000),
})
@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset / 1pct (configuración predeterminada)

  • Descripción config: 1pct del conjunto de entrenamiento IMAGEnet total.

  • Tamaño del paquete: 254.22 KiB

  • Tamaño de conjunto de datos: 7.61 GiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 12,811
'validation' 50.000

Visualización

imagenet2012_subset / 10pct

  • Descripción config: 10pct del conjunto de entrenamiento IMAGEnet total.

  • Tamaño del paquete: 2.48 MiB

  • Tamaño de conjunto de datos: 19.91 GiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 128,116
'validation' 50.000

Visualización