wake_vision

  • Description :

Wake Vision est un vaste ensemble de données de haute qualité comprenant plus de 6 millions d'images, dépassant largement l'échelle et la diversité des ensembles de données tinyML actuels (100x). Cet ensemble de données comprend des images avec des annotations indiquant si chaque image contient une personne. De plus, il intègre une référence complète et fine pour évaluer l'équité et la robustesse, couvrant le sexe perçu, l'âge perçu, la distance du sujet, les conditions d'éclairage et les représentations. Les étiquettes Wake Vision sont dérivées des annotations d'Open Image qui sont sous licence Google LLC sous licence CC BY 4.0. Les images sont répertoriées comme ayant une licence CC BY 2.0. Remarque d'Open Images : "bien que nous ayons essayé d'identifier les images sous licence Creative Commons Attribution, nous ne faisons aucune déclaration ni garantie concernant le statut de licence de chaque image et vous devez vérifier vous-même la licence de chaque image."

Diviser Exemples
  • Structure des fonctionnalités :
FeaturesDict({
    'age_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'body_part': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'bright': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'dark': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'far': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'filename': Text(shape=(), dtype=string),
    'gender_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'medium_distance': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'middle_age': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'near': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_non-depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'normal_lighting': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'older': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_female': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_male': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'young': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Documentation des fonctionnalités :
Fonctionnalité Classe Forme Type D Description
FonctionnalitésDict
âge_inconnu Étiquette de classe int64
partie_corps Étiquette de classe int64
brillant Étiquette de classe int64
sombre Étiquette de classe int64
représentation Étiquette de classe int64
loin Étiquette de classe int64
nom de fichier Texte chaîne
genre_inconnu Étiquette de classe int64
image Image (Aucun, Aucun, 3) uint8
moyenne_distance Étiquette de classe int64
âge_moyen Étiquette de classe int64
près Étiquette de classe int64
non-person_depiction Étiquette de classe int64
non-person_non-depiction Étiquette de classe int64
éclairage_normal Étiquette de classe int64
plus vieux Étiquette de classe int64
personne Étiquette de classe int64
représentation_personne Étiquette de classe int64
majoritairement_femelle Étiquette de classe int64
majoritairement_masculin Étiquette de classe int64
jeune Étiquette de classe int64
@article{banbury2024wake,
  title={Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection},
  author={Banbury, Colby and Njor, Emil and Stewart, Matthew and Warden, Pete and Kudlur, Manjunath and Jeffries, Nat and Fafoutis, Xenofon and Reddi, Vijay Janapa},
  journal={arXiv preprint arXiv:2405.00892},
  year={2024}
}