Pomoc chronić Wielkiej Rafy Koralowej z TensorFlow na Kaggle Dołącz Wyzwanie

imagenet2012_subset

Imagenet2012Subset jest podzbiorem oryginalnego zbioru danych ImageNet ILSVRC 2012. Zbiór danych akcji ten sam zestaw walidacji jako oryginalny IMAGEnet ILSVRC 2012 zbiorze. Jednak zestaw uczący jest podpróbkowany w sposób zrównoważony pod względem etykiety. W 1pct konfiguracji, 1%, lub 12811, obrazy są próbkowane Większość klas mają taką samą liczbę obrazów (średnio 12,8), niektóre klasy mają losowo jeden kolejny przykład od innych; i 10pct konfiguracji, ~ 10% lub 128116 Większość klas mają taką samą liczbę obrazów (średnia 128), a niektóre klasy mają losowo 1 przykładu niż inne.

To ma być używany jako punkt odniesienia dla semi-nadzorowanego uczenia się i został pierwotnie stosowany w SimCLR papieru ( https://arxiv.org/abs/2002.05709 ).

  • Strona domowa: http://image-net.org/

  • Kod źródłowy: tfds.image_classification.Imagenet2012Subset

  • wersje:

    • 2.0.0 : Fix etykiety walidacji.
    • 2.0.1 : Kodowanie poprawkę. Brak zmian z punktu widzenia użytkownika.
    • 3.0.0 : Fix koloryzacji na ~ 12 obrazów (CMYK -> RGB). Popraw format dla spójności (przekonwertuj pojedynczy obraz png na JPEG). Szybszy odczyt generacji bezpośrednio z archiwum.

    • 4.0.0 : (niepublikowane)

    • 5.0.0 (domyślnie): Nowy rozłam API ( https://tensorflow.org/datasets/splits )

    • 5.1.0 : Dodano testy podzielone.

  • Ręczne pobieranie instrukcje: Ten zestaw danych wymaga, aby ręcznie pobrać dane źródłowe do download_config.manual_dir (domyślnie ~/tensorflow_datasets/downloads/manual/ )
    manual_dir powinien zawierać dwa pliki: ILSVRC2012_img_train.tar i ILSVRC2012_img_val.tar. Musisz zarejestrować się na http://www.image-net.org/download-images aby otrzymać link do pobrania zestawu danych.

  • Auto-buforowane ( dokumentacja ): Nie

  • Cechy:

FeaturesDict({
    'file_name': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=1000),
})
@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset/1pct (konfiguracja domyślna)

  • Opis config: 1pct całkowitej zestawu treningowego IMAGEnet.

  • Wielkość pliku: 254.22 KiB

  • Zbiór danych rozmiar: 7.61 GiB

  • dzieli:

Podział Przykłady
'train' 12 811
'validation' 50 000

Wyobrażanie sobie

imagenet2012_subset/10pct

  • Opis config: 10pct całkowitej zestawu treningowego IMAGEnet.

  • Wielkość pliku: 2.48 MiB

  • Zbiór danych rozmiar: 19.91 GiB

  • dzieli:

Podział Przykłady
'train' 128 116
'validation' 50 000

Wyobrażanie sobie