voxceleb

  • Description:

Un ensemble de données à grande échelle pour l'identification du locuteur. Ces données sont collectées auprès de plus de 1 251 locuteurs, avec plus de 150 000 échantillons au total. Cette version contient la partie audio de l'ensemble de données voxceleb1.1.

  • Page d' accueil: http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html

  • Code source: tfds.audio.Voxceleb

  • versions:

    • 1.2.1 (par défaut) : Ajouter un champ youtube_id
  • Taille du téléchargement: 4.68 MiB

  • Taille Dataset: 107.98 GiB

  • Instructions de téléchargement Manuel: Cet ensemble de données , vous devez télécharger les données source manuellement dans download_config.manual_dir (par défaut ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir doit contenir le fichier vox_dev_wav.zip. Les instructions pour télécharger ce fichier se trouvent dans http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html Ce jeu de données nécessite une inscription.

  • Mis en cache automatique ( documentation ): Non

  • scissions:

Diviser Exemples
'test' 7 972
'train' 134 000
'validation' 6 670
  • Caractéristiques:
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=1252),
    'youtube_id': Text(shape=(), dtype=tf.string),
})
  • citation:
@InProceedings{Nagrani17,
    author       = "Nagrani, A. and Chung, J.~S. and Zisserman, A.",
    title        = "VoxCeleb: a large-scale speaker identification dataset",
    booktitle    = "INTERSPEECH",
    year         = "2017",
}