cifrar10_1

El conjunto de datos CIFAR-10.1 es un nuevo conjunto de prueba para CIFAR-10. CIFAR-10.1 contiene aproximadamente 2000 nuevas imágenes de prueba que fueron muestreadas después de varios años de investigación en el conjunto de datos CIFAR-10 original. La recopilación de datos para CIFAR-10.1 se diseñó para minimizar el cambio de distribución en relación con el conjunto de datos original. Describimos la creación de CIFAR-10.1 en el documento "¿Los clasificadores de CIFAR-10 se generalizan a CIFAR-10?". Las imágenes en CIFAR-10.1 son un subconjunto del conjunto de datos de TinyImages. Actualmente hay dos versiones del conjunto de datos CIFAR-10.1: v4 y v6.

FeaturesDict({
    'image': Image(shape=(32, 32, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
imagen Imagen (32, 32, 3) uint8
etiqueta Etiqueta de clase int64
  • Claves supervisadas (Ver as_supervised ): ('image', 'label')

  • Cita :

@article{recht2018cifar10.1,
  author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
  title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
  year = {2018},
  note = {\url{https://arxiv.org/abs/1806.00451} },
}

@article{torralba2008tinyimages,
  author = {Antonio Torralba and Rob Fergus and William T. Freeman},
  journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
  year = {2008},
  volume = {30},
  number = {11},
  pages = {1958-1970}
}

cifar10_1/v4 (configuración predeterminada)

  • Descripción de la configuración : es la primera versión de nuestro conjunto de datos en la que probamos cualquier clasificador. Como se mencionó anteriormente, esto hace que el conjunto de datos v4 sea independiente de los clasificadores que evaluamos. Los números informados en las secciones principales de nuestro documento utilizan esta versión del conjunto de datos. Se creó a partir de las 25 palabras clave principales de TinyImages para cada clase, lo que condujo a un ligero desequilibrio de clase. La mayor diferencia es que los barcos representan solo el 8% del conjunto de prueba en lugar del 10%. v4 contiene 2021 imágenes.

  • Tamaño de la descarga : 5.93 MiB

  • Tamaño del conjunto de datos : 4.46 MiB

  • Divisiones :

Separar Ejemplos
'test' 2,021

Visualización

cifrar10_1/v6

  • Descripción de la configuración : se deriva de una asignación de palabras clave ligeramente mejorada que está exactamente equilibrada por clase. Esta versión del conjunto de datos corresponde a los resultados del Apéndice D de nuestro artículo. v6 contiene 2000 imágenes.

  • Tamaño de la descarga : 5.87 MiB

  • Tamaño del conjunto de datos : 4.40 MiB

  • Divisiones :

Separar Ejemplos
'test' 2,000

Visualización