O Dia da Comunidade de ML é dia 9 de novembro! Junte-nos para atualização de TensorFlow, JAX, e mais Saiba mais

voxforja

  • Descrição:

VoxForge é um conjunto de dados de classificação de linguagem. Consiste em clipes de áudio enviados pelo usuário e enviados ao site. Neste lançamento, são coletados dados de 6 idiomas - inglês, espanhol, francês, alemão, russo e italiano. Como o site é atualizado constantemente, e para fins de reprodutibilidade, este lançamento contém apenas gravações enviadas antes de 01-01-2020. As amostras são divididas entre trem, validação e teste para que as amostras de cada alto-falante pertençam a exatamente uma divisão.

  • Homepage: http://www.voxforge.org/

  • O código-fonte: tfds.audio.Voxforge

  • versões:

    • 1.0.0 (padrão): Não há notas de lançamento.
  • Tamanho do download: Unknown size

  • Tamanho do conjunto de dados: Unknown size

  • Instruções baixar o manual: Este conjunto de dados requer que você baixe os dados de origem manualmente para download_config.manual_dir (o padrão é ~/tensorflow_datasets/downloads/manual/ ):
    O VoxForge requer o download manual dos arquivos de áudio. A lista completa de arquivos podem ser encontrados em https://storage.googleapis.com/tfds-data/downloads/voxforge/voxforge_urls.txt Ele pode ser baixado usando o seguinte comando: wget -i voxforge_urls.txt -x Nota que o download e construir o conjunto de dados localmente requer ~ 100 GB de espaço em disco (mas apenas ~ 60 GB serão usados ​​permanentemente).

  • Cache-Auto ( documentação ): Desconhecido

  • desdobramentos:

Dividir Exemplos
  • Características:
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    'speaker_id': tf.string,
})
@article{maclean2018voxforge,
  title={Voxforge},
  author={MacLean, Ken},
  journal={Ken MacLean.[Online]. Available: http://www.voxforge.org/home.[Acedido em 2012]},
  year={2018}
}