Ayuda a proteger la Gran Barrera de Coral con TensorFlow en Kaggle Únete Challenge

imagenet2012

ILSVRC 2012, comúnmente conocido como 'ImageNet' es un conjunto de datos de imágenes organizado de acuerdo con la jerarquía de WordNet. Cada concepto significativo en WordNet, posiblemente descrito por varias palabras o frases de palabras, se denomina "conjunto de sinónimos" o "synset". Hay más de 100,000 synsets en WordNet, la mayoría de ellos son sustantivos (80,000+). En ImageNet, nuestro objetivo es proporcionar un promedio de 1000 imágenes para ilustrar cada synset. Las imágenes de cada concepto tienen control de calidad y anotaciones humanas. Una vez finalizado, esperamos que ImageNet ofrezca decenas de millones de imágenes ordenadas de forma limpia para la mayoría de los conceptos de la jerarquía de WordNet.

La división de prueba contiene 100.000 imágenes pero no etiquetas porque no se han publicado etiquetas. Brindamos soporte para la división de prueba de 2012 con el parche menor lanzado el 10 de octubre de 2019. Para descargar manualmente estos datos, el usuario debe realizar las siguientes operaciones:

  1. Descargar la división 2012 de prueba disponible aquí .
  2. Descargue el parche del 10 de octubre de 2019. Hay un enlace de Google Drive al parche que se proporciona en la misma página.
  3. Combine las dos bolas de alquitrán, sobrescribiendo manualmente las imágenes del archivo original con imágenes del parche. De acuerdo con las instrucciones de image-net.org, este procedimiento sobrescribe solo algunas imágenes.

La bola de alquitrán resultante puede ser procesada por TFDS.

Para evaluar la precisión de un modelo en la división de prueba de ImageNet, se debe ejecutar una inferencia en todas las imágenes de la división y exportar esos resultados a un archivo de texto que se debe cargar en el servidor de evaluación de ImageNet. Los encargados del mantenimiento del servidor de evaluación de ImageNet permiten que un solo usuario envíe hasta 2 presentaciones por semana para evitar el sobreajuste.

Para evaluar la precisión de la división de prueba, primero se debe crear una cuenta en image-net.org. Esta cuenta debe ser aprobada por el administrador del sitio. Una vez creada la cuenta, se puede presentar los resultados al servidor de prueba en https://image-net.org/challenges/LSVRC/eval_server.php La presentación consta de varios archivos de texto ASCII que corresponden a múltiples tareas. La tarea de interés es "Envío de clasificación (error de las 5 principales cls)". Una muestra de un archivo de texto exportado tiene el siguiente aspecto:

771 778 794 387 650
363 691 764 923 427
737 369 430 531 124
755 930 755 59 168

El formato de exportación se describe en su totalidad en "readme.txt" en el kit de desarrollo de 2013 disponible aquí: http://imagenet.stanford.edu/image/ilsvrc2013/ILSVRC2013_devkit.tgz Por favor, consulte la sección titulada "formato de presentación 3.3 CLS-LOC ". Brevemente, el formato del archivo de texto es 100.000 líneas correspondientes a cada imagen en la división de prueba. Cada línea de números enteros corresponde a las 5 predicciones principales ordenadas por rango para cada imagen de prueba. Los enteros están indexados en 1 correspondiente al número de línea en el archivo de etiquetas correspondiente. Consulte imagenet2012_labels.txt.

  • Inicio: http://image-net.org/

  • El código fuente: tfds.image_classification.Imagenet2012

  • versiones:

    • 2.0.0 etiquetas de validación Fix:.
    • 2.0.1 : La codificación de corrección. Sin cambios desde el punto de vista del usuario.
    • 3.0.0 : coloración Fix en ~ 12 imágenes (CMYK -> RGB). Corrija el formato para mantener la coherencia (convierta la imagen png única a Jpeg). Lectura de generación más rápida directamente desde el archivo.

    • 4.0.0 : (no publicado)

    • 5.0.0 : Nueva API de división ( https://tensorflow.org/datasets/splits )

    • 5.1.0 (por defecto): Añadido prueba dividida.

  • Tamaño del paquete: Unknown size

  • Tamaño de conjunto de datos: 155.84 GiB

  • Las instrucciones de descarga manual: Este conjunto de datos se requiere para descargar los datos de origen manualmente en download_config.manual_dir (por defecto ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir debe contener dos archivos: ILSVRC2012_img_train.tar e ILSVRC2012_img_val.tar. Es necesario registrarse en http://www.image-net.org/download-images con el fin de obtener el enlace para descargar el conjunto de datos.

  • Auto-caché ( documentación ): No

  • Fraccionamientos:

Separar Ejemplos de
'test' 100.000
'train' 1,281,167
'validation' 50.000
  • características:
FeaturesDict({
    'file_name': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=1000),
})

Visualización

  • Cita:
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal   = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}