imagenet2012_real

Cet ensemble de données contient des images de validation ILSVRC-2012 (ImageNet) complétées par un nouvel ensemble d'étiquettes "Re-Assessed" (ReaL) de l'article "Are we done with ImageNet", voir https://arxiv.org/abs/2006.07159 Ces les étiquettes sont collectées à l'aide du protocole amélioré, ce qui se traduit par des annotations multi-étiquettes et plus précises.

Remarque importante : environ 3500 exemples ne contiennent pas d'étiquette, ceux-ci doivent être exclus de la moyenne lors du calcul de la précision . Une façon possible de le faire est d'utiliser le code NumPy suivant :

is_correct = [pred in real_labels[i] for i, pred in enumerate(predictions) if real_labels[i]]
real_accuracy = np.mean(is_correct)
  • Page d'accueil : https://github.com/google-research/reassessed-imagenet

  • Code source : tfds.datasets.imagenet2012_real.Builder

  • Versions :

    • 1.0.0 (par défaut) : version initiale
  • Taille du téléchargement : 379.37 KiB

  • Taille du jeu de données : 6.25 GiB

  • Instructions de téléchargement manuel : cet ensemble de données nécessite que vous téléchargiez manuellement les données sources dans download_config.manual_dir (par défaut, ~/tensorflow_datasets/downloads/manual/ ) :
    manual_dir doit contenir le fichier ILSVRC2012_img_val.tar . Vous devez vous inscrire sur http://www.image-net.org/download-images afin d'obtenir le lien pour télécharger l'ensemble de données.

  • Mise en cache automatique ( documentation ): Non

  • Fractionnements :

Diviser Exemples
'validation' 50 000
  • Structure des fonctionnalités :
FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'original_label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
    'real_label': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=1000)),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
nom de fichier Texte chaîne de caractères
image Image (Aucun, Aucun, 3) uint8
étiquette_d'origine Étiquette de classe int64
real_label Séquence(ClassLabel) (Aucun,) int64

Visualisation

  • Citation :
@article{beyer2020imagenet,
  title={Are we done with ImageNet?},
  author={Lucas Beyer and Olivier J. Henaff and Alexander Kolesnikov and Xiaohua Zhai and Aaron van den Oord},
  journal={arXiv preprint arXiv:2002.05709},
  year={2020}
}
@article{ILSVRC15,
  Author={Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
  Title={ {ImageNet Large Scale Visual Recognition Challenge} },
  Year={2015},
  journal={International Journal of Computer Vision (IJCV)},
  doi={10.1007/s11263-015-0816-y},
  volume={115},
  number={3},
  pages={211-252}
}