Pomoc chronić Wielkiej Rafy Koralowej z TensorFlow na Kaggle Dołącz Wyzwanie

imagenet2012

ILSVRC 2012, powszechnie znany jako „ImageNet”, to zestaw danych obrazu zorganizowany zgodnie z hierarchią WordNet. Każda znacząca koncepcja w WordNet, prawdopodobnie opisana wieloma słowami lub frazami słownymi, nazywana jest „zestawem synonimów” lub „zestawem synonimów”. W WordNet jest ponad 100 000 synsetów, większość z nich to rzeczowniki (80 000+). W ImageNet staramy się dostarczyć średnio 1000 obrazów ilustrujących każdy synset. Obrazy każdej koncepcji są kontrolowane pod względem jakości i opatrzone adnotacjami ludzkimi. Mamy nadzieję, że po jego zakończeniu ImageNet zaoferuje dziesiątki milionów czysto posortowanych obrazów dla większości pojęć w hierarchii WordNet.

Podział testowy zawiera obrazy 100 tys., ale nie ma etykiet, ponieważ żadne etykiety nie zostały opublikowane. Zapewniamy wsparcie dla testowego splitu z 2012 roku z drobną łatką wydaną 10 października 2019 roku. W celu ręcznego pobrania tych danych użytkownik musi wykonać następujące operacje:

  1. Pobierz rozłam 2012 Test dostępny tutaj .
  2. Pobierz łatkę z 10 października 2019 r. Na tej samej stronie znajduje się link Dysku Google do poprawki.
  3. Połącz dwie kule tar, ręcznie nadpisując dowolne obrazy w oryginalnym archiwum obrazami z łatki. Zgodnie z instrukcjami na image-net.org ta procedura nadpisuje tylko kilka obrazów.

Powstała kula tar może być następnie przetwarzana przez TFDS.

Aby ocenić dokładność modelu w podziale testowym ImageNet, należy uruchomić wnioskowanie na wszystkich obrazach w podziale, wyeksportować te wyniki do pliku tekstowego, który należy przesłać na serwer oceny ImageNet. Opiekunowie serwera ewaluacyjnego ImageNet zezwalają jednemu użytkownikowi na przesłanie do 2 zgłoszeń tygodniowo, aby zapobiec nadmiernemu dopasowaniu.

Aby ocenić dokładność podziału testowego, należy najpierw utworzyć konto na image-net.org. To konto musi zostać zatwierdzone przez administratora witryny. Po założeniu konta można przesłać wyniki do serwera testowego na https://image-net.org/challenges/LSVRC/eval_server.php Zgłoszenie składa się z kilku plików tekstowych ASCII odpowiadających wielu zadań. Zadaniem będącym przedmiotem zainteresowania jest „Przesyłanie klasyfikacji (błąd top-5 cls)”. Przykładowy wyeksportowany plik tekstowy wygląda następująco:

771 778 794 387 650
363 691 764 923 427
737 369 430 531 124
755 930 755 59 168

Format eksportu opisany jest w całości w „readme.txt” w zestawie dostępnym 2013 rozwojowej tutaj: http://imagenet.stanford.edu/image/ilsvrc2013/ILSVRC2013_devkit.tgz proszę zobaczyć sekcję „3.3 CLS-LOC formacie uległość ”. W skrócie, format pliku tekstowego to 100 000 wierszy odpowiadających każdemu obrazowi w podziale testowym. Każdy wiersz liczb całkowitych odpowiada uporządkowanym według rangi pięciu najlepszym przewidywaniom dla każdego obrazu testowego. Liczby całkowite mają indeks 1, co odpowiada numerowi wiersza w odpowiednim pliku etykiet. Zobacz plik imagenet2012_labels.txt.

  • Strona domowa: http://image-net.org/

  • Kod źródłowy: tfds.image_classification.Imagenet2012

  • wersje:

    • 2.0.0 : Fix etykiety walidacji.
    • 2.0.1 : Kodowanie poprawkę. Brak zmian z punktu widzenia użytkownika.
    • 3.0.0 : Fix koloryzacji na ~ 12 obrazów (CMYK -> RGB). Popraw format dla spójności (przekonwertuj pojedynczy obraz png na JPEG). Szybszy odczyt generacji bezpośrednio z archiwum.

    • 4.0.0 : (niepublikowane)

    • 5.0.0 : Nowy rozłam API ( https://tensorflow.org/datasets/splits )

    • 5.1.0 (domyślnie): Dodano testy podzielone.

  • Wielkość pliku: Unknown size

  • Zbiór danych rozmiar: 155.84 GiB

  • Ręczne pobieranie instrukcje: Ten zestaw danych wymaga, aby ręcznie pobrać dane źródłowe do download_config.manual_dir (domyślnie ~/tensorflow_datasets/downloads/manual/ )
    manual_dir powinien zawierać dwa pliki: ILSVRC2012_img_train.tar i ILSVRC2012_img_val.tar. Musisz zarejestrować się na http://www.image-net.org/download-images aby otrzymać link do pobrania zestawu danych.

  • Auto-buforowane ( dokumentacja ): Nie

  • dzieli:

Podział Przykłady
'test' 100 000
'train' 1,281,167
'validation' 50 000
  • Cechy:
FeaturesDict({
    'file_name': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=1000),
})

Wyobrażanie sobie

  • cytat:
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal   = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}