passe

PASS est un ensemble de données d'images à grande échelle qui n'inclut aucun humain, partie humaine ou autre information personnellement identifiable. Il peut être utilisé pour une pré-formation auto-supervisée de haute qualité tout en réduisant considérablement les problèmes de confidentialité.

PASS contient 1 439 589 images sans aucune étiquette provenant de YFCC-100M.

Toutes les images de cet ensemble de données sont sous licence CC-BY, tout comme l'ensemble de données lui-même. Pour YFCC-100M, voir http://www.multimediacommons.org/

  • Documentation complémentaire : Explorer sur Papers With Code

  • Page d' accueil : https://www.robots.ox.ac.uk/~vgg/data/pass/

  • Code source : tfds.datasets.pass.Builder

  • Versions :

    • 1.0.0 : Version initiale.
    • 2.0.0 : v2 : Suppression de 472 images de la v1 car elles contenaient des humains. Métadonnées également ajoutées : date de prise de vue et GPS.
    • 3.0.0 (par défaut) : v3 : Suppression de 131 images de la v2 car elles contenaient des humains/tatouages.
  • Taille du téléchargement : 167.30 GiB

  • Taille du jeu de données : 166.43 GiB

  • Mise en cache automatique ( documentation ): Non

  • Fractionnements :

Diviser Exemples
'train' 1 439 588
  • Structure des fonctionnalités :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/creator_uname': Text(shape=(), dtype=string),
    'image/date_taken': Text(shape=(), dtype=string),
    'image/gps_lat': float32,
    'image/gps_lon': float32,
    'image/hash': Text(shape=(), dtype=string),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
image Image (Aucun, Aucun, 3) uint8
image/creator_uname Texte chaîne de caractères
image/date_prise Texte chaîne de caractères
image/gps_lat Tenseur float32
image/gps_lon Tenseur float32
image/hachage Texte chaîne de caractères

Visualisation

  • Citation :
@Article{asano21pass,
author = "Yuki M. Asano and Christian Rupprecht and Andrew Zisserman and Andrea Vedaldi",
title = "PASS: An ImageNet replacement for self-supervised pretraining without humans",
journal = "NeurIPS Track on Datasets and Benchmarks",
year = "2021"
}