cifar10_1

  • Opis :

Zbiór danych CIFAR-10.1 to nowy zestaw testowy dla CIFAR-10. CIFAR-10.1 zawiera około 2000 nowych obrazów testowych, które pobrano po wielu latach badań nad oryginalnym zbiorem danych CIFAR-10. Gromadzenie danych dla CIFAR-10.1 zaprojektowano tak, aby zminimalizować przesunięcie dystrybucji w stosunku do oryginalnego zbioru danych. Opis powstania CIFAR-10.1 opisujemy w artykule „Czy klasyfikatory CIFAR-10 generalizują na CIFAR-10?”. Obrazy w CIFAR-10.1 stanowią podzbiór zbioru danych TinyImages. Obecnie istnieją dwie wersje zbioru danych CIFAR-10.1: v4 i v6.

FeaturesDict({
    'image': Image(shape=(32, 32, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDykt
obraz Obraz (32, 32, 3) uint8
etykieta Etykieta klasy int64
@article{recht2018cifar10.1,
  author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
  title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
  year = {2018},
  note = {\url{https://arxiv.org/abs/1806.00451} },
}

@article{torralba2008tinyimages,
  author = {Antonio Torralba and Rob Fergus and William T. Freeman},
  journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
  year = {2008},
  volume = {30},
  number = {11},
  pages = {1958-1970}
}

cifar10_1/v4 (konfiguracja domyślna)

  • Opis konfiguracji : Jest to pierwsza wersja naszego zbioru danych, na której testowaliśmy dowolny klasyfikator. Jak wspomniano powyżej, sprawia to, że zbiór danych v4 jest niezależny od ocenianych przez nas klasyfikatorów. Liczby podane w głównych sekcjach naszego artykułu wykorzystują tę wersję zbioru danych. Został zbudowany z 25 najpopularniejszych słów kluczowych TinyImages dla każdej klasy, co doprowadziło do niewielkiej nierównowagi klas. Największą różnicą jest to, że statki stanowią tylko 8% zestawu testowego zamiast 10%. wersja 4 zawiera 2021 obrazów.

  • Rozmiar pobierania : 5.93 MiB

  • Rozmiar zbioru danych : 4.46 MiB

  • Podziały :

Podział Przykłady
'test' 2021

Wyobrażanie sobie

cifar10_1/v6

  • Opis konfiguracji : wywodzi się z nieco ulepszonego przydziału słów kluczowych, który jest dokładnie zrównoważony pod względem klas. Ta wersja zbioru danych odpowiada wynikom zawartym w Załączniku D naszego artykułu. wersja 6 zawiera 2000 obrazów.

  • Rozmiar pobierania : 5.87 MiB

  • Rozmiar zbioru danych : 4.40 MiB

  • Podziały :

Podział Przykłady
'test' 2000

Wyobrażanie sobie