Wizualizacja : Eksploruj w regionie Poznaj swoje dane
opis :
Zestaw danych CIFAR-10.1 to nowy zestaw testów dla CIFAR-10. CIFAR-10.1 zawiera około 2000 nowych obrazów testowych, które zostały pobrane po wielu latach badań nad oryginalnym zestawem danych CIFAR-10. Zbieranie danych dla CIFAR-10.1 zostało zaprojektowane tak, aby zminimalizować przesunięcie rozkładu w stosunku do oryginalnego zestawu danych. Stworzenie CIFAR-10.1 opisujemy w artykule „Do CIFAR-10 Classifiers Generalize to CIFAR-10?”. Obrazy w CIFAR-10.1 są podzbiorem zbioru danych TinyImages. Obecnie istnieją dwie wersje zbioru danych CIFAR-10.1: v4 i v6.
Strona główna : https://github.com/modestyachts/CIFAR-10.1
Kod źródłowy :
tfds.image_classification.Cifar10_1
Wersje :
-
1.1.0
(domyślnie): Brak informacji o wersji.
-
Automatyczne buforowanie ( dokumentacja ): Tak
Struktura funkcji :
FeaturesDict({
'image': Image(shape=(32, 32, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
obraz | Obraz | (32, 32, 3) | uint8 | |
etykieta | Etykieta klasy | int64 |
Klucze nadzorowane (zobacz dokument
as_supervised
):('image', 'label')
Cytat :
@article{recht2018cifar10.1,
author = {Benjamin Recht and Rebecca Roelofs and Ludwig Schmidt and Vaishaal Shankar},
title = {Do CIFAR-10 Classifiers Generalize to CIFAR-10?},
year = {2018},
note = {\url{https://arxiv.org/abs/1806.00451} },
}
@article{torralba2008tinyimages,
author = {Antonio Torralba and Rob Fergus and William T. Freeman},
journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
title = {80 Million Tiny Images: A Large Data Set for Nonparametric Object and Scene Recognition},
year = {2008},
volume = {30},
number = {11},
pages = {1958-1970}
}
cifar10_1/v4 (domyślna konfiguracja)
Opis konfiguracji : Jest to pierwsza wersja naszego zbioru danych, na której przetestowaliśmy dowolny klasyfikator. Jak wspomniano powyżej, sprawia to, że zestaw danych v4 jest niezależny od ocenianych przez nas klasyfikatorów. Liczby podane w głównych sekcjach naszego artykułu wykorzystują tę wersję zestawu danych. Został zbudowany z 25 najlepszych słów kluczowych TinyImages dla każdej klasy, co doprowadziło do niewielkiej nierównowagi klas. Największa różnica polega na tym, że statki stanowią tylko 8% zestawu testowego zamiast 10%. v4 zawiera 2021 obrazów.
Rozmiar pliku do pobrania :
5.93 MiB
Rozmiar zestawu danych :
4.46 MiB
Podziały :
Rozdzielać | Przykłady |
---|---|
'test' | 2021 |
- Rysunek ( tfds.show_examples ):
- Przykłady ( tfds.as_dataframe ):
cifar10_1/v6
Opis konfiguracji : Pochodzi z nieco ulepszonego przydziału słów kluczowych, który jest dokładnie zrównoważony klasowo. Ta wersja zestawu danych odpowiada wynikom w dodatku D do naszego artykułu. Wersja 6 zawiera 2000 obrazów.
Rozmiar pliku do pobrania :
5.87 MiB
Rozmiar zestawu danych :
4.40 MiB
Podziały :
Rozdzielać | Przykłady |
---|---|
'test' | 2000 |
- Rysunek ( tfds.show_examples ):
- Przykłady ( tfds.as_dataframe ):