Visualizzazione : Esplora in Conosci i tuoi dati
Descrizione :
Il set di dati CIFAR-10.1 è un nuovo set di test per CIFAR-10. CIFAR-10.1 contiene circa 2.000 nuove immagini di prova che sono state campionate dopo diversi anni di ricerca sul set di dati CIFAR-10 originale. La raccolta dei dati per CIFAR-10.1 è stata progettata per ridurre al minimo lo spostamento della distribuzione rispetto al set di dati originale. Descriviamo la creazione di CIFAR-10.1 nel documento "Do CIFAR-10 Classifiers Generalize to CIFAR-10?". Le immagini in CIFAR-10.1 sono un sottoinsieme del set di dati TinyImages. Esistono attualmente due versioni del set di dati CIFAR-10.1: v4 e v6.
Homepage : https://github.com/modestyachts/CIFAR-10.1
Codice sorgente :
tfds.image_classification.Cifar10_1
Versioni :
-
1.1.0
(impostazione predefinita): nessuna nota di rilascio.
-
Auto-cache ( documentazione ): Sì
Struttura delle caratteristiche :
FeaturesDict({
'image': Image(shape=(32, 32, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
Immagine | Immagine | (32, 32, 3) | uint8 | |
etichetta | ClassLabel | int64 |
Chiavi supervisionate (vedi
as_supervised
doc ):('image', 'label')
Citazione :
@article{recht2018cifar10.1,
author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
year = {2018},
note = {\url{https://arxiv.org/abs/1806.00451} },
}
@article{torralba2008tinyimages,
author = {Antonio Torralba and Rob Fergus and William T. Freeman},
journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
year = {2008},
volume = {30},
number = {11},
pages = {1958-1970}
}
cifar10_1/v4 (configurazione predefinita)
Descrizione della configurazione : è la prima versione del nostro set di dati su cui abbiamo testato qualsiasi classificatore. Come accennato in precedenza, questo rende il set di dati v4 indipendente dai classificatori che valutiamo. I numeri riportati nelle sezioni principali del nostro articolo utilizzano questa versione del set di dati. È stato costruito dalle prime 25 parole chiave TinyImages per ogni classe, il che ha portato a un leggero squilibrio di classe. La più grande differenza è che le navi costituiscono solo l'8% del set di test invece del 10%. v4 contiene 2.021 immagini.
Dimensione del download :
5.93 MiB
Dimensione del set di dati:
4.46 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 2.021 |
- Figura ( tfds.show_examples ):
- Esempi ( tfds.as_dataframe ):
cifar10_1/v6
Descrizione della configurazione : deriva da un'allocazione delle parole chiave leggermente migliorata che è esattamente bilanciata per classe. Questa versione del set di dati corrisponde ai risultati nell'Appendice D del nostro articolo. v6 contiene 2.000 immagini.
Dimensione del download :
5.87 MiB
Dimensione del set di dati :
4.40 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 2.000 |
- Figura ( tfds.show_examples ):
- Esempi ( tfds.as_dataframe ):