Halaman ini diterjemahkan oleh Cloud Translation API.
Switch to English

imagenet2012

  • Deskripsi :

ILSVRC 2012, umumnya dikenal sebagai 'ImageNet' adalah kumpulan data gambar yang diatur menurut hierarki WordNet. Setiap konsep yang bermakna di WordNet, mungkin dijelaskan dengan beberapa kata atau frasa kata, disebut "set sinonim" atau "synset". Ada lebih dari 100.000 synset di WordNet, kebanyakan dari mereka adalah kata benda (80.000+). Di ImageNet, kami bertujuan untuk menyediakan rata-rata 1000 gambar untuk mengilustrasikan setiap synset. Gambar dari setiap konsep dikontrol kualitasnya dan diberi keterangan oleh manusia. Dalam penyelesaiannya, kami berharap ImageNet akan menawarkan puluhan juta gambar yang diurutkan dengan rapi untuk sebagian besar konsep dalam hierarki WordNet.

Pembagian uji berisi 100 ribu gambar tetapi tidak ada label karena tidak ada label yang dirilis secara publik. Kami menyediakan dukungan untuk pemisahan uji dari 2012 dengan patch minor dirilis pada 10 Oktober 2019. Untuk mengunduh data ini secara manual, pengguna harus melakukan operasi berikut:

  1. Unduh test split 2012 yang tersedia di sini .
  2. Unduh patch 10 Oktober 2019. Ada tautan Google Drive ke tambalan yang disediakan di halaman yang sama.
  3. Gabungkan dua bola tar, secara manual menimpa gambar apa pun di arsip asli dengan gambar dari tambalan. Menurut petunjuk di image-net.org, prosedur ini hanya menimpa beberapa gambar.

Tar-ball yang dihasilkan kemudian dapat diproses oleh TFDS.

Untuk menilai keakuratan model pada pemisahan pengujian ImageNet, seseorang harus menjalankan inferensi pada semua gambar dalam pemisahan, mengekspor hasil tersebut ke file teks yang harus diunggah ke server evaluasi ImageNet. Pengelola server evaluasi ImageNet mengizinkan satu pengguna untuk mengirimkan hingga 2 kiriman per minggu untuk mencegah overfitting.

Untuk mengevaluasi keakuratan pada test split, pertama-tama harus membuat akun di image-net.org. Akun ini harus disetujui oleh administrator situs. Setelah akun dibuat, seseorang dapat mengirimkan hasilnya ke server pengujian di http://www.image-net.org/challenges/LSVRC/2013/test_server . Pengajuan terdiri dari beberapa file teks ASCII yang sesuai dengan beberapa tugas. Tugas yang menarik adalah "Penyerahan klasifikasi (kesalahan 5 cls teratas)". Contoh file teks yang diekspor terlihat seperti berikut:

771 778 794 387 650
363 691 764 923 427
737 369 430 531 124
755 930 755 59 168

Format ekspor dijelaskan secara lengkap di "readme.txt" dalam kit pengembangan 2013 yang tersedia di sini: http://imagenet.stanford.edu/image/ilsvrc2013/ILSVRC2013_devkit.tgz Silakan lihat bagian berjudul "3.3 format pengiriman CLS-LOC ". Singkatnya, format file teks adalah 100.000 baris yang sesuai dengan setiap gambar dalam test split. Setiap baris bilangan bulat sesuai dengan urutan peringkat, 5 prediksi teratas untuk setiap gambar pengujian. Integer 1 diindeks sesuai dengan nomor baris di file label terkait. Lihat imagenet2012_labels.txt.

  • Beranda : http://image-net.org/

  • Kode sumber : tfds.image_classification.Imagenet2012

  • Versi :

    • 2.0.0 : Perbaiki label validasi.
    • 2.0.1 : Perbaikan encoding. Tidak ada perubahan dari sudut pandang pengguna.
    • 3.0.0 : Perbaiki pewarnaan pada ~ 12 gambar (CMYK -> RGB). Perbaiki format untuk konsistensi (ubah satu gambar png ke Jpeg). Generasi lebih cepat membaca langsung dari arsip.

    • 4.0.0 : (tidak dipublikasikan)

    • 5.0.0 : API split baru ( https://tensorflow.org/datasets/splits )

    • 5.1.0 (default): Menambahkan pemisahan pengujian.

  • Ukuran unduhan : Unknown size

  • Ukuran 155.84 GiB data : 155.84 GiB

  • Petunjuk pengunduhan manual : Dataset ini mengharuskan Anda untuk mengunduh data sumber secara manual ke dalam download_config.manual_dir (defaultnya ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir harus berisi dua file: ILSVRC2012_img_train.tar dan ILSVRC2012_img_val.tar. Anda perlu mendaftar di http://www.image-net.org/download-images untuk mendapatkan link untuk mendownload dataset.

  • Cache otomatis ( dokumentasi ): Tidak

  • Split :

Membagi Contoh
'test' 100.000
'train' 1.281.167
'validation' 50.000
  • Fitur :
FeaturesDict({
    'file_name': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=1000),
})
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal   = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}

Visualisasi