Halaman ini diterjemahkan oleh Cloud Translation API.
Switch to English

imagenet2012_subset

  • Deskripsi :

Imagenet2012Subset adalah bagian dari kumpulan data asli ImageNet ILSVRC 2012. Dataset berbagi set validasi yang sama dengan set data asli ImageNet ILSVRC 2012. Namun, set pelatihan disubsampel dengan label gaya seimbang. Dalam konfigurasi 1pct , 1%, atau 12811, gambar diambil sampelnya, sebagian besar kelas memiliki jumlah gambar yang sama (rata-rata 12,8), beberapa kelas secara acak memiliki 1 contoh lebih banyak daripada yang lain; dan dalam konfigurasi 10pct , ~ 10%, atau 128116, sebagian besar kelas memiliki jumlah gambar yang sama (rata-rata 128), dan beberapa kelas secara acak memiliki 1 contoh lebih banyak daripada yang lain.

Ini seharusnya digunakan sebagai patokan untuk semi-supervised learning, dan aslinya telah digunakan dalam makalah SimCLR ( https://arxiv.org/abs/2002.05709 ).

  • Beranda : http://image-net.org/

  • Kode sumber : tfds.image_classification.Imagenet2012Subset

  • Versi :

    • 2.0.0 : Perbaiki label validasi.
    • 2.0.1 : Perbaikan encoding. Tidak ada perubahan dari sudut pandang pengguna.
    • 3.0.0 : Perbaiki pewarnaan pada ~ 12 gambar (CMYK -> RGB). Perbaiki format untuk konsistensi (ubah satu gambar png ke Jpeg). Generasi lebih cepat membaca langsung dari arsip.

    • 4.0.0 : (tidak dipublikasikan)

    • 5.0.0 (default): API split baru ( https://tensorflow.org/datasets/splits )

    • 5.1.0 : Menambahkan pemisahan uji.

  • Petunjuk pengunduhan manual : Dataset ini mengharuskan Anda untuk mengunduh data sumber secara manual ke dalam download_config.manual_dir (defaultnya ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir harus berisi dua file: ILSVRC2012_img_train.tar dan ILSVRC2012_img_val.tar. Anda harus mendaftar di http://www.image-net.org/download-images untuk mendapatkan link untuk mendownload dataset.

  • Cache otomatis ( dokumentasi ): Tidak

  • Fitur :

FeaturesDict({
    'file_name': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=1000),
})
@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset / 1pct (konfigurasi default)

  • Deskripsi konfigurasi : 1pct dari total set pelatihan ImageNet.

  • Ukuran download : 254.22 KiB

  • Ukuran set data : 7.61 GiB

  • Split :

Membagi Contoh
'train' 12.811
'validation' 50.000

Visualisasi

imagenet2012_subset / 10pct

  • Deskripsi konfigurasi : 10pct dari total set pelatihan ImageNet.

  • Ukuran download : 2.48 MiB

  • Ukuran 19.91 GiB data : 19.91 GiB

  • Split :

Membagi Contoh
'train' 128.116
'validation' 50.000

Visualisasi