imagenet2012_subset

Imagenet2012Subset to podzbiór oryginalnego zbioru danych ImageNet ILSVRC 2012. Zestaw danych ma ten sam zestaw do sprawdzania poprawności, co oryginalny zestaw danych ImageNet ILSVRC 2012. Jednak zestaw treningowy jest podpróbkowany w zrównoważony sposób. W konfiguracji 1pct próbkowane jest 1% lub 12811 obrazów, większość klas ma taką samą liczbę obrazów (średnio 12,8), niektóre klasy losowo mają o 1 przykład więcej niż inne; aw konfiguracji 10pct , ~10% lub 128116, większość klas ma taką samą liczbę obrazów (średnio 128), a niektóre klasy losowo mają o 1 przykład więcej niż inne.

Ma to służyć jako punkt odniesienia dla uczenia się częściowo nadzorowanego i zostało pierwotnie użyte w dokumencie SimCLR ( https://arxiv.org/abs/2002.05709 ).

  • Strona główna : http://image-net.org/

  • Kod źródłowy : tfds.datasets.imagenet2012_subset.Builder

  • Wersje :

    • 2.0.0 : Napraw etykiety sprawdzania poprawności.
    • 2.0.1 : Poprawka kodowania. Bez zmian z punktu widzenia użytkownika.
    • 3.0.0 : Naprawiono kolorowanie na ~12 obrazach (CMYK -> RGB). Popraw format, aby uzyskać spójność (przekonwertuj pojedynczy obraz png na Jpeg). Szybsze generowanie odczytu bezpośrednio z archiwum.

    • 4.0.0 : (nieopublikowane)

    • 5.0.0 (domyślnie): nowy podzielony interfejs API ( https://tensorflow.org/datasets/splits )

    • 5.1.0 : Dodano podział testu.

  • Instrukcje ręcznego pobierania : ten zestaw danych wymaga ręcznego pobrania danych źródłowych do download_config.manual_dir (domyślnie ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir powinien zawierać dwa pliki: ILSVRC2012_img_train.tar i ILSVRC2012_img_val.tar. Musisz zarejestrować się na https://image-net.org/download-images , aby uzyskać link do pobrania zestawu danych.

  • Automatyczne buforowanie ( dokumentacja ): Nie

  • Struktura funkcji :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
Nazwa pliku Tekst strunowy
obraz Obraz (Brak, Brak, 3) uint8
etykieta Etykieta klasy int64
@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset/1pct (domyślna konfiguracja)

  • Opis konfiguracji : 1 procent całego zestawu szkoleniowego ImageNet.

  • Rozmiar pliku do pobrania : 254.22 KiB

  • Rozmiar zestawu danych : 7.61 GiB

  • Podziały :

Rozdzielać Przykłady
'train' 12811
'validation' 50 000

Wyobrażanie sobie

imagenet2012_subset/10pct

  • Opis konfiguracji : 10% całego zestawu szkoleniowego ImageNet.

  • Rozmiar pliku do pobrania : 2.48 MiB

  • Rozmiar zestawu danych : 19.91 GiB

  • Podziały :

Rozdzielać Przykłady
'train' 128116
'validation' 50 000

Wyobrażanie sobie