Visualisation : Explorer dans Know Your Data
Descriptif :
Open Images est un ensemble de données d'environ 9 millions d'images qui ont été annotées avec des étiquettes au niveau de l'image et des cadres de délimitation d'objets.
L'ensemble d'apprentissage de la V4 contient 14,6 millions de boîtes englobantes pour 600 classes d'objets sur 1,74 million d'images, ce qui en fait le plus grand ensemble de données existant avec des annotations d'emplacement d'objet. Les boîtes ont été en grande partie dessinées manuellement par des annotateurs professionnels pour assurer l'exactitude et la cohérence. Les images sont très diverses et contiennent souvent des scènes complexes avec plusieurs objets (8,4 par image en moyenne). De plus, l'ensemble de données est annoté avec des étiquettes au niveau de l'image couvrant des milliers de classes.
Documentation complémentaire : Explorer sur Papers With Code
Page d' accueil : https://storage.googleapis.com/openimages/web/index.html
Code source :
tfds.datasets.open_images_v4.Builder
Versions :
-
2.0.0
(par défaut) : nouvelle API fractionnée ( https://tensorflow.org/datasets/splits )
-
Taille du téléchargement :
565.11 GiB
Mise en cache automatique ( documentation ): Non
Fractionnements :
Diviser | Exemples |
---|---|
'test' | 125 436 |
'train' | 1 743 042 |
'validation' | 41 620 |
- Structure des fonctionnalités :
FeaturesDict({
'bobjects': Sequence({
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'is_depiction': int8,
'is_group_of': int8,
'is_inside': int8,
'is_occluded': int8,
'is_truncated': int8,
'label': ClassLabel(shape=(), dtype=int64, num_classes=601),
'source': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/filename': Text(shape=(), dtype=string),
'objects': Sequence({
'confidence': int32,
'label': ClassLabel(shape=(), dtype=int64, num_classes=19995),
'source': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'objects_trainable': Sequence({
'confidence': int32,
'label': ClassLabel(shape=(), dtype=int64, num_classes=7186),
'source': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
bobjets | Séquence | |||
bobjets/bbox | BBoxFeature | (4,) | float32 | |
bobjects/is_depiction | Tenseur | int8 | ||
bobjects/est_group_of | Tenseur | int8 | ||
bobjects/is_inside | Tenseur | int8 | ||
bobjects/est_occlus | Tenseur | int8 | ||
bobjects/is_truncated | Tenseur | int8 | ||
bobjets/étiquette | Étiquette de classe | int64 | ||
bobjets/source | Étiquette de classe | int64 | ||
image | Image | (Aucun, Aucun, 3) | uint8 | |
image/nom de fichier | Texte | chaîne de caractères | ||
objets | Séquence | |||
objets/confiance | Tenseur | int32 | ||
objets/étiquette | Étiquette de classe | int64 | ||
objets/source | Étiquette de classe | int64 | ||
objets_entraînables | Séquence | |||
objets_entraînables/confiance | Tenseur | int32 | ||
objects_trainable/étiquette | Étiquette de classe | int64 | ||
objects_trainable/source | Étiquette de classe | int64 |
Clés supervisées (Voir
as_supervised
doc ):None
Citation :
@article{OpenImages,
author = {Alina Kuznetsova and
Hassan Rom and
Neil Alldrin and
Jasper Uijlings and
Ivan Krasin and
Jordi Pont-Tuset and
Shahab Kamali and
Stefan Popov and
Matteo Malloci and
Tom Duerig and
Vittorio Ferrari},
title = {The Open Images Dataset V4: Unified image classification,
object detection, and visual relationship detection at scale},
year = {2018},
journal = {arXiv:1811.00982}
}
@article{OpenImages2,
author = {Krasin, Ivan and
Duerig, Tom and
Alldrin, Neil and
Ferrari, Vittorio
and Abu-El-Haija, Sami and
Kuznetsova, Alina and
Rom, Hassan and
Uijlings, Jasper and
Popov, Stefan and
Kamali, Shahab and
Malloci, Matteo and
Pont-Tuset, Jordi and
Veit, Andreas and
Belongie, Serge and
Gomes, Victor and
Gupta, Abhinav and
Sun, Chen and
Chechik, Gal and
Cai, David and
Feng, Zheyun and
Narayanan, Dhyanesh and
Murphy, Kevin},
title = {OpenImages: A public dataset for large-scale multi-label and
multi-class image classification.},
journal = {Dataset available from
https://storage.googleapis.com/openimages/web/index.html},
year={2017}
}
open_images_v4/original (configuration par défaut)
Description de la configuration : Images à leur résolution et qualité d'origine.
Taille du jeu de données :
562.42 GiB
Figure ( tfds.show_examples ):
- Exemples ( tfds.as_dataframe ):
open_images_v4/300k
Description de la configuration : Les images ont environ 300 000 pixels, en qualité JPEG 72.
Taille du jeu de données :
81.92 GiB
Figure ( tfds.show_examples ):
- Exemples ( tfds.as_dataframe ):
open_images_v4/200k
Description de la configuration : Les images ont environ 200 000 pixels, en qualité JPEG 72.
Taille du jeu de données :
60.70 GiB
Figure ( tfds.show_examples ):
- Exemples ( tfds.as_dataframe ):