- Description :
Imagenet2012Subset est un sous-ensemble de l'ensemble de données ImageNet ILSVRC 2012 original. L'ensemble de données partage le même ensemble de validation que l'ensemble de données ImageNet ILSVRC 2012 d'origine. Cependant, l’ensemble de formation est sous-échantillonné de manière équilibrée. Dans 1pct
configuration 1 %, soit 12 811 images sont échantillonnées, la plupart des classes ont le même nombre d'images (en moyenne 12,8), certaines classes ont aléatoirement 1 exemple de plus que d'autres ; et dans une configuration 10pct
, ~10 %, ou 128 116, la plupart des classes ont le même nombre d'images (en moyenne 128), et certaines classes ont aléatoirement 1 exemple de plus que d'autres.
Ceci est censé être utilisé comme référence pour l'apprentissage semi-supervisé et a été utilisé à l'origine dans l'article SimCLR ( https://arxiv.org/abs/2002.05709 ).
Page d'accueil : http://image-net.org/
Code source :
tfds.datasets.imagenet2012_subset.Builder
Versions :
-
2.0.0
: Correction des étiquettes de validation. -
2.0.1
: Correction de l'encodage. Aucun changement du point de vue de l'utilisateur. 3.0.0
: Correction de la colorisation sur ~12 images (CMJN -> RVB). Correction du format pour plus de cohérence (convertir l'image png unique en Jpeg). Lecture de génération plus rapide directement à partir de l’archive.4.0.0
: (non publié)5.0.0
(par défaut) : nouvelle API fractionnée ( https://tensorflow.org/datasets/splits )5.1.0
: Ajout du fractionnement de test.
-
Instructions de téléchargement manuel : cet ensemble de données nécessite que vous téléchargiez les données sources manuellement dans
download_config.manual_dir
(par défaut~/tensorflow_datasets/downloads/manual/
) :
manual_dir doit contenir deux fichiers : ILSVRC2012_img_train.tar et ILSVRC2012_img_val.tar. Vous devez vous inscrire sur https://image-net.org/download-images afin d'obtenir le lien pour télécharger l'ensemble de données.Mise en cache automatique ( documentation ) : Non
Structure des fonctionnalités :
FeaturesDict({
'file_name': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
- Documentation des fonctionnalités :
Fonctionnalité | Classe | Forme | Type D | Description |
---|---|---|---|---|
FonctionnalitésDict | ||||
nom de fichier | Texte | chaîne | ||
image | Image | (Aucun, Aucun, 3) | uint8 | |
étiquette | Étiquette de classe | int64 |
Clés supervisées (Voir doc
as_supervised
) :('image', 'label')
Citation :
@article{chen2020simple,
title={A Simple Framework for Contrastive Learning of Visual Representations},
author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
journal={arXiv preprint arXiv:2002.05709},
year={2020}
}
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}
imagenet2012_subset/1pct (configuration par défaut)
Description de la configuration : 1 % de l'ensemble total de formation ImageNet.
Taille du téléchargement :
254.22 KiB
Taille de l'ensemble de données :
7.61 GiB
Divisions :
Diviser | Exemples |
---|---|
'train' | 12 811 |
'validation' | 50 000 |
- Figure ( tfds.show_examples ) :
- Exemples ( tfds.as_dataframe ) :
imagenet2012_subset/10pct
Description de la configuration : 10 % de l'ensemble total de formation ImageNet.
Taille du téléchargement :
2.48 MiB
Taille de l'ensemble de données :
19.91 GiB
Divisions :
Diviser | Exemples |
---|---|
'train' | 128 116 |
'validation' | 50 000 |
- Figure ( tfds.show_examples ) :
- Exemples ( tfds.as_dataframe ) :