cifar10_1

L'ensemble de données CIFAR-10.1 est un nouvel ensemble de test pour CIFAR-10. CIFAR-10.1 contient environ 2 000 nouvelles images de test qui ont été échantillonnées après plusieurs années de recherche sur l'ensemble de données CIFAR-10 original. La collecte de données pour CIFAR-10.1 a été conçue pour minimiser le changement de distribution par rapport à l'ensemble de données d'origine. Nous décrivons la création de CIFAR-10.1 dans l'article "Do CIFAR-10 Classifiers Generalize to CIFAR-10?". Les images de CIFAR-10.1 sont un sous-ensemble de l'ensemble de données TinyImages. Il existe actuellement deux versions de l'ensemble de données CIFAR-10.1 : v4 et v6.

FeaturesDict({
    'image': Image(shape=(32, 32, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
image Image (32, 32, 3) uint8
étiquette Étiquette de classe int64
@article{recht2018cifar10.1,
  author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
  title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
  year = {2018},
  note = {\url{https://arxiv.org/abs/1806.00451} },
}

@article{torralba2008tinyimages,
  author = {Antonio Torralba and Rob Fergus and William T. Freeman},
  journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
  year = {2008},
  volume = {30},
  number = {11},
  pages = {1958-1970}
}

cifar10_1/v4 (configuration par défaut)

  • Description de la configuration : C'est la première version de notre jeu de données sur laquelle nous avons testé n'importe quel classifieur. Comme mentionné ci-dessus, cela rend l'ensemble de données v4 indépendant des classificateurs que nous évaluons. Les chiffres rapportés dans les principales sections de notre article utilisent cette version de l'ensemble de données. Il a été construit à partir des 25 meilleurs mots-clés TinyImages pour chaque classe, ce qui a entraîné un léger déséquilibre de classe. La plus grande différence est que les navires ne représentent que 8% de l'ensemble de test au lieu de 10%. v4 contient 2 021 images.

  • Taille du téléchargement : 5.93 MiB

  • Taille du jeu de données : 4.46 MiB

  • Fractionnements :

Diviser Exemples
'test' 2 021

Visualisation

cifar10_1/v6

  • Description de la configuration : elle est dérivée d'une allocation de mots-clés légèrement améliorée qui est exactement équilibrée par classe. Cette version de l'ensemble de données correspond aux résultats de l'annexe D de notre article. v6 contient 2 000 images.

  • Taille du téléchargement : 5.87 MiB

  • Taille du jeu de données : 4.40 MiB

  • Fractionnements :

Diviser Exemples
'test' 2 000

Visualisation