Visualisation : Explorer dans Know Your Data
Descriptif :
PASS est un ensemble de données d'images à grande échelle qui n'inclut aucun humain, partie humaine ou autre information personnellement identifiable. Il peut être utilisé pour une pré-formation auto-supervisée de haute qualité tout en réduisant considérablement les problèmes de confidentialité.
PASS contient 1 439 589 images sans aucune étiquette provenant de YFCC-100M.
Toutes les images de cet ensemble de données sont sous licence CC-BY, tout comme l'ensemble de données lui-même. Pour YFCC-100M, voir http://www.multimediacommons.org/
Documentation complémentaire : Explorer sur Papers With Code
Page d' accueil : https://www.robots.ox.ac.uk/~vgg/data/pass/
Code source :
tfds.datasets.pass.Builder
Versions :
-
1.0.0
: Version initiale. -
2.0.0
: v2 : Suppression de 472 images de la v1 car elles contenaient des humains. Métadonnées également ajoutées : date de prise de vue et GPS. -
3.0.0
(par défaut) : v3 : Suppression de 131 images de la v2 car elles contenaient des humains/tatouages.
-
Taille du téléchargement :
167.30 GiB
Taille du jeu de données :
166.43 GiB
Mise en cache automatique ( documentation ): Non
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 439 588 |
- Structure des fonctionnalités :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/creator_uname': Text(shape=(), dtype=string),
'image/date_taken': Text(shape=(), dtype=string),
'image/gps_lat': float32,
'image/gps_lon': float32,
'image/hash': Text(shape=(), dtype=string),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
image | Image | (Aucun, Aucun, 3) | uint8 | |
image/creator_uname | Texte | chaîne de caractères | ||
image/date_prise | Texte | chaîne de caractères | ||
image/gps_lat | Tenseur | float32 | ||
image/gps_lon | Tenseur | float32 | ||
image/hachage | Texte | chaîne de caractères |
Clés supervisées (Voir
as_supervised
doc ):None
Figure ( tfds.show_examples ):
- Exemples ( tfds.as_dataframe ):
- Citation :
@Article{asano21pass,
author = "Yuki M. Asano and Christian Rupprecht and Andrew Zisserman and Andrea Vedaldi",
title = "PASS: An ImageNet replacement for self-supervised pretraining without humans",
journal = "NeurIPS Track on Datasets and Benchmarks",
year = "2021"
}