voxforge

  • Description:

VoxForge est un ensemble de données de classification linguistique. Il se compose de clips audio soumis par l'utilisateur et soumis au site Web. Dans cette version, les données de 6 langues sont collectées : anglais, espagnol, français, allemand, russe et italien. Étant donné que le site Web est constamment mis à jour et par souci de reproductibilité, ce communiqué ne contient que les enregistrements soumis avant le 01-01-2020. Les échantillons sont répartis entre le train, la validation et le test de sorte que les échantillons de chaque locuteur appartiennent à exactement une division.

  • Page d' accueil: http://www.voxforge.org/

  • Code source: tfds.audio.Voxforge

  • versions:

    • 1.0.0 (par défaut): Aucune note de version.
  • Taille du téléchargement: Unknown size

  • Taille Dataset: Unknown size

  • Instructions de téléchargement Manuel: Cet ensemble de données , vous devez télécharger les données source manuellement dans download_config.manual_dir (par défaut ~/tensorflow_datasets/downloads/manual/ ):
    VoxForge nécessite le téléchargement manuel des archives audio. La liste complète des archives se trouve dans https://storage.googleapis.com/tfds-data/downloads/voxforge/voxforge_urls.txt Il peut être téléchargé à l' aide de la commande suivante: wget -i voxforge_urls.txt -x Notez que le téléchargement et la création de l'ensemble de données localement nécessite environ 100 Go d'espace disque (mais seulement environ 60 Go seront utilisés en permanence).

  • Mis en cache automatique ( documentation ): Inconnu

  • scissions:

Diviser Exemples
  • Caractéristiques:
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    'speaker_id': tf.string,
})
@article{maclean2018voxforge,
  title={Voxforge},
  author={MacLean, Ken},
  journal={Ken MacLean.[Online]. Available: http://www.voxforge.org/home.[Acedido em 2012]},
  year={2018}
}