imagenet2012_subset

Imagenet2012Subset est un sous-ensemble de l'ensemble de données original ImageNet ILSVRC 2012. Le jeu de données partage le même jeu de validation que le jeu de données ImageNet ILSVRC 2012 d'origine. Cependant, l'ensemble d'apprentissage est sous-échantillonné de manière équilibrée par étiquette. Dans la configuration 1pct , 1%, ou 12811, les images sont échantillonnées, la plupart des classes ont le même nombre d'images (moyenne 12,8), certaines classes ont au hasard 1 exemple de plus que d'autres ; et en configuration 10pct , ~10%, ou 128116, la plupart des classes ont le même nombre d'images (moyenne 128), et certaines classes ont au hasard 1 exemple de plus que d'autres.

Ceci est censé être utilisé comme référence pour l'apprentissage semi-supervisé et a été utilisé à l'origine dans l'article SimCLR ( https://arxiv.org/abs/2002.05709 ).

  • Page d'accueil : http://image-net.org/

  • Code source : tfds.datasets.imagenet2012_subset.Builder

  • Versions :

    • 2.0.0 : Correction des étiquettes de validation.
    • 2.0.1 : Correction de l'encodage. Aucun changement du point de vue de l'utilisateur.
    • 3.0.0 : Correction de la colorisation sur ~12 images (CMJN -> RVB). Correction du format pour plus de cohérence (convertir l'image png unique en Jpeg). Génération plus rapide en lisant directement à partir de l'archive.

    • 4.0.0 : (inédit)

    • 5.0.0 (par défaut) : nouvelle API fractionnée ( https://tensorflow.org/datasets/splits )

    • 5.1.0 : Ajout de la division de test.

  • Instructions de téléchargement manuel : cet ensemble de données nécessite que vous téléchargiez manuellement les données sources dans download_config.manual_dir (par défaut, ~/tensorflow_datasets/downloads/manual/ ) :
    manual_dir doit contenir deux fichiers : ILSVRC2012_img_train.tar et ILSVRC2012_img_val.tar. Vous devez vous inscrire sur https://image-net.org/download-images afin d'obtenir le lien pour télécharger l'ensemble de données.

  • Mise en cache automatique ( documentation ): Non

  • Structure des fonctionnalités :

FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
nom de fichier Texte chaîne de caractères
image Image (Aucun, Aucun, 3) uint8
étiquette Étiquette de classe int64
@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset/1pct (configuration par défaut)

  • Description de la configuration : 1% du total de l'ensemble de formation ImageNet.

  • Taille du téléchargement : 254.22 KiB

  • Taille du jeu de données : 7.61 GiB

  • Fractionnements :

Diviser Exemples
'train' 12 811
'validation' 50 000

Visualisation

imagenet2012_subset/10pct

  • Description de la configuration : 10 % du total de l'ensemble de formation ImageNet.

  • Taille du téléchargement : 2.48 MiB

  • Taille du jeu de données : 19.91 GiB

  • Fractionnements :

Diviser Exemples
'train' 128 116
'validation' 50 000

Visualisation