- Tanım :
Imagenet2012Subset, orijinal ImageNet ILSVRC 2012 veri kümesinin bir alt kümesidir. Veri kümesi, orijinal ImageNet ILSVRC 2012 veri kümesiyle aynı doğrulama kümesini paylaşır. Ancak eğitim seti etiket dengeli bir şekilde alt örneklenmiştir. 1pct
konfigürasyonunda, %1 veya 12811, görüntüler örneklenir, çoğu sınıf aynı sayıda görüntüye sahiptir (ortalama 12,8), bazı sınıflar rastgele diğerlerinden 1 daha fazla örneğe sahiptir; ve 10pct
yapılandırmasında, ~%10 veya 128116, çoğu sınıf aynı sayıda görüntüye sahiptir (ortalama 128) ve bazı sınıflar rastgele diğerlerinden 1 daha fazla örneğe sahiptir.
Bunun yarı denetimli öğrenme için bir kıyaslama olarak kullanılması gerekiyordu ve orijinal olarak SimCLR makalesinde kullanıldı ( https://arxiv.org/abs/2002.05709 ).
Ana sayfa : http://image-net.org/
Kaynak kodu :
tfds.datasets.imagenet2012_subset.Builder
Sürümler :
-
2.0.0
: Doğrulama etiketlerini düzeltin. -
2.0.1
: Kodlama düzeltmesi. Kullanıcı açısından herhangi bir değişiklik yok. 3.0.0
: ~12 görüntüdeki renklendirmeyi düzeltin (CMYK -> RGB). Tutarlılık için formatı düzeltin (tek png görüntüsünü Jpeg'e dönüştürün). Doğrudan arşivden daha hızlı nesil okuma.4.0.0
: (yayınlanmadı)5.0.0
(varsayılan): Yeni bölünmüş API ( https://tensorflow.org/datasets/splits )5.1.0
: Test bölümü eklendi.
-
Manuel indirme talimatları : Bu veri kümesi, kaynak verilerini manuel olarak
download_config.manual_dir
içine indirmenizi gerektirir (varsayılan olarak~/tensorflow_datasets/downloads/manual/
şeklindedir):
manual_dir iki dosya içermelidir: ILSVRC2012_img_train.tar ve ILSVRC2012_img_val.tar. Veri kümesini indirme bağlantısını almak için https://image-net.org/download-images adresine kaydolmanız gerekir.Otomatik önbelleğe alınmış ( belgeler ): Hayır
Özellik yapısı :
FeaturesDict({
'file_name': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
dosya adı | Metin | sicim | ||
resim | Resim | (Yok, Yok, 3) | uint8 | |
etiket | SınıfEtiketi | int64 |
Denetlenen anahtarlar (
as_supervised
belgesine bakın):('image', 'label')
Alıntı :
@article{chen2020simple,
title={A Simple Framework for Contrastive Learning of Visual Representations},
author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
journal={arXiv preprint arXiv:2002.05709},
year={2020}
}
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}
imagenet2012_subset/1pct (varsayılan yapılandırma)
Yapılandırma açıklaması : Toplam ImageNet eğitim setinin 1 kısmı.
İndirme boyutu :
254.22 KiB
Veri kümesi boyutu :
7.61 GiB
Bölünmeler :
Bölmek | Örnekler |
---|---|
'train' | 12.811 |
'validation' | 50.000 |
- Şekil ( tfds.show_examples ):
- Örnekler ( tfds.as_dataframe ):
imagenet2012_subset/10pct
Yapılandırma açıklaması : Toplam ImageNet eğitim setinin yüzde 10'u.
İndirme boyutu :
2.48 MiB
Veri kümesi boyutu :
19.91 GiB
Bölünmeler :
Bölmek | Örnekler |
---|---|
'train' | 128.116 |
'validation' | 50.000 |
- Şekil ( tfds.show_examples ):
- Örnekler ( tfds.as_dataframe ):