Merci de vous être connecté à Google I/O. Voir toutes les sessions à la demande Regarder à la demande

voxcélébrité

  • Descriptif :

Un ensemble de données à grande échelle pour l'identification du locuteur. Ces données sont collectées auprès de plus de 1 251 locuteurs, avec plus de 150 000 échantillons au total. Cette version contient la partie audio de l'ensemble de données voxceleb1.1.

Diviser Exemples
'test' 7 972
'train' 134 000
'validation' 6 670
  • Structure des fonctionnalités :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1252),
    'youtube_id': Text(shape=(), dtype=string),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
l'audio l'audio (Aucun,) int64
étiquette Étiquette de classe int64
youtube_id Texte chaîne de caractères
  • Citation :
@InProceedings{Nagrani17,
    author       = "Nagrani, A. and Chung, J.~S. and Zisserman, A.",
    title        = "VoxCeleb: a large-scale speaker identification dataset",
    booktitle    = "INTERSPEECH",
    year         = "2017",
}