imagenet2012_subset

Imagenet2012Subset, orijinal ImageNet ILSVRC 2012 veri kümesinin bir alt kümesidir. Veri kümesi, orijinal ImageNet ILSVRC 2012 veri kümesiyle aynı doğrulama kümesini paylaşır. Bununla birlikte, eğitim seti, etiket dengeli bir şekilde alt örneklenir. 1pct konfigürasyonunda, %1 veya 12811, görüntüler örneklenir, çoğu sınıf aynı sayıda görüntüye sahiptir (ortalama 12,8), bazı sınıflar rastgele olarak diğerlerinden 1 örnek daha içerir; ve 10pct konfigürasyonunda, ~%10 veya 128116, çoğu sınıf aynı sayıda görüntüye (ortalama 128) sahiptir ve bazı sınıflar rasgele diğerlerinden 1 örnek daha içerir.

Bunun yarı denetimli öğrenme için bir kıyaslama noktası olarak kullanılması gerekiyordu ve orijinal olarak SimCLR belgesinde kullanıldı ( https://arxiv.org/abs/2002.05709 ).

  • Ana sayfa : http://image-net.org/

  • Kaynak kodu : tfds.image_classification.Imagenet2012Subset

  • Sürümler :

    • 2.0.0 : Doğrulama etiketlerini düzeltin.
    • 2.0.1 : Kodlama düzeltmesi. Kullanıcı açısından herhangi bir değişiklik yok.
    • 3.0.0 : ~12 görüntüde renklendirmeyi düzeltin (CMYK -> RGB). Tutarlılık için formatı düzeltin (tek png görüntüsünü Jpeg'e dönüştürün). Doğrudan arşivden daha hızlı nesil okuma.

    • 4.0.0 : (yayınlanmadı)

    • 5.0.0 (varsayılan): Yeni bölünmüş API ( https://tensorflow.org/datasets/splits )

    • 5.1.0 : Test bölümü eklendi.

  • Manuel indirme talimatları : Bu veri kümesi, kaynak verileri download_config.manual_dir içine manuel olarak download_config.manual_dir gerektirir (varsayılanı ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir iki dosya içermelidir: ILSVRC2012_img_train.tar ve ILSVRC2012_img_val.tar. Veri setini indirme bağlantısını almak için https://image-net.org/download-images adresinden kayıt olmanız gerekmektedir.

  • Otomatik önbelleğe alınmış ( belgeler ): Hayır

  • Özellik yapısı :

FeaturesDict({
    'file_name': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=1000),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtype Tanım
ÖzelliklerDict
dosya adı Metin tf.string
resim resim (Yok, Yok, 3) tf.uint8
etiket sınıf etiketi tf.int64
@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset/1pct (varsayılan yapılandırma)

  • Yapılandırma açıklaması : Toplam ImageNet eğitim setinin 1 adeti.

  • İndirme boyutu : 254.22 KiB

  • Veri kümesi boyutu : 7.61 GiB

  • Bölmeler :

Bölmek Örnekler
'train' 12.811
'validation' 50.000

imagenet2012_subset/10pct

  • Yapılandırma açıklaması : Toplam ImageNet eğitim setinin yüzde 10'u.

  • İndirme boyutu : 2.48 MiB

  • Veri kümesi boyutu : 19.91 GiB

  • Bölmeler :

Bölmek Örnekler
'train' 128,116
'validation' 50.000