Ayuda a proteger la Gran Barrera de Coral con TensorFlow en Kaggle Únete Challenge

cifar10_1

El conjunto de datos CIFAR-10.1 es un nuevo conjunto de pruebas para CIFAR-10. CIFAR-10.1 contiene aproximadamente 2,000 nuevas imágenes de prueba que fueron muestreadas después de varios años de investigación en el conjunto de datos CIFAR-10 original. La recopilación de datos para CIFAR-10.1 se diseñó para minimizar el cambio de distribución en relación con el conjunto de datos original. Describimos la creación de CIFAR-10.1 en el artículo "¿Los clasificadores CIFAR-10 se generalizan a CIFAR-10?". Las imágenes de CIFAR-10.1 son un subconjunto del conjunto de datos de TinyImages. Actualmente existen dos versiones del conjunto de datos CIFAR-10.1: v4 y v6.

FeaturesDict({
    'image': Image(shape=(32, 32, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
})
@article{recht2018cifar10.1,
  author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
  title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
  year = {2018},
  note = {\url{https://arxiv.org/abs/1806.00451} },
}

@article{torralba2008tinyimages,
  author = {Antonio Torralba and Rob Fergus and William T. Freeman},
  journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
  year = {2008},
  volume = {30},
  number = {11},
  pages = {1958-1970}
}

cifar10_1 / v4 (configuración predeterminada)

  • Descripción config: Es la primera versión de nuestro conjunto de datos sobre la que hemos probado ningún clasificador. Como se mencionó anteriormente, esto hace que el conjunto de datos v4 sea independiente de los clasificadores que evaluamos. Los números informados en las secciones principales de nuestro artículo utilizan esta versión del conjunto de datos. Se construyó a partir de las 25 principales palabras clave de TinyImages para cada clase, lo que provocó un ligero desequilibrio de clases. La mayor diferencia es que los barcos representan solo el 8% del conjunto de prueba en lugar del 10%. v4 contiene 2021 imágenes.

  • Tamaño del paquete: 5.93 MiB

  • Conjunto de datos de tamaño: 4.46 MiB

  • Fraccionamientos:

Separar Ejemplos de
'test' 2.021

Visualización

cifar10_1 / v6

  • Descripción Config: Se deriva de una asignación de palabras clave ligeramente mejorada que es exactamente la clase equilibrada. Esta versión del conjunto de datos corresponde a los resultados del Apéndice D de nuestro artículo. v6 contiene 2000 imágenes.

  • Tamaño del paquete: 5.87 MiB

  • Conjunto de datos de tamaño: 4.40 MiB

  • Fraccionamientos:

Separar Ejemplos de
'test' 2.000

Visualización