imagenet2012_subset

Imagenet2012Subset est un sous-ensemble de l'ensemble de données ImageNet ILSVRC 2012 d'origine. La part du jeu de données même ensemble de validation que l'ensemble de données IMAGEnet ILSVRC 2012 d' origine. Cependant, l'ensemble d'apprentissage est sous-échantillonné de manière équilibrée par étiquette. Dans 1pct configuration, 1% ou 12811, les images sont échantillonnées, la plupart des classes ont le même nombre d'images (moyenne 12,8), certaines classes ont au hasard 1 exemple plus que d' autres; et 10pct configuration, ~ 10%, ou 128116, la plupart des classes ont le même nombre d'images (moyenne 128), et certaines classes ont au hasard 1 exemple plus que d' autres.

Ce système est censé être utilisé comme référence pour l' apprentissage semi-supervisé, et a été utilisé à l' origine dans le papier SimCLR ( https://arxiv.org/abs/2002.05709 ).

  • Page d' accueil: http://image-net.org/

  • Code Source: tfds.image_classification.Imagenet2012Subset

  • versions:

    • 2.0.0 : Correction des étiquettes de validation.
    • 2.0.1 : codage correctif. Aucun changement du point de vue de l'utilisateur.
    • 3.0.0 : Correction colorisation sur ~ 12 images (CMJN -> RGB). Correction du format pour la cohérence (convertir l'image png unique en Jpeg). Lecture de génération plus rapide directement à partir de l'archive.

    • 4.0.0 : (non publié)

    • 5.0.0 (par défaut): Nouvelle API split ( https://tensorflow.org/datasets/splits )

    • 5.1.0 : Test split Ajouté.

  • Instructions de téléchargement Manuel: Cet ensemble de données , vous devez télécharger les données source manuellement dans download_config.manual_dir (par défaut ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir doit contenir deux fichiers : ILSVRC2012_img_train.tar et ILSVRC2012_img_val.tar. Vous devez vous inscrire sur http://www.image-net.org/download-images afin d'obtenir le lien pour télécharger le jeu de données.

  • Mis en cache automatique ( documentation ): Non

  • Caractéristiques:

FeaturesDict({
    'file_name': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=1000),
})
@article{chen2020simple,
  title={A Simple Framework for Contrastive Learning of Visual Representations},
  author={Chen, Ting and Kornblith, Simon and Norouzi, Mohammad and Hinton, Geoffrey},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title = { {ImageNet Large Scale Visual Recognition Challenge} },
  Year = {2015},
  journal   = {International Journal of Computer Vision (IJCV)},
  doi = {10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}

imagenet2012_subset/1pct (configuration par défaut)

  • Description Config: 1pct de jeu total de la formation IMAGEnet.

  • Taille du téléchargement: 254.22 KiB

  • Taille Dataset: 7.61 GiB

  • scissions:

Diviser Exemples
'train' 12 811
'validation' 50 000

Visualisation

imagenet2012_subset/10pct

  • Description Config: 10pct de jeu total de la formation IMAGEnet.

  • Taille du téléchargement: 2.48 MiB

  • Taille Dataset: 19.91 GiB

  • scissions:

Diviser Exemples
'train' 128 116
'validation' 50 000

Visualisation