Aprenda o que há de mais recente em aprendizado de máquina, IA generativa e muito mais no WiML Symposium 2023 Registre-se

Esta página foi traduzida pela API Cloud Translation.

libretos

Descrição :

LibriTTS é um corpus de inglês para vários falantes de aproximadamente 585 horas de leitura de fala em inglês a uma taxa de amostragem de 24kHz, preparado por Heiga Zen com a ajuda dos membros da equipe do Google Speech e do Google Brain. O corpus LibriTTS é projetado para pesquisa TTS. É derivado dos materiais originais (arquivos de áudio mp3 do LibriVox e arquivos de texto do Projeto Gutenberg) do corpus LibriSpeech. As principais diferenças do corpus LibriSpeech estão listadas abaixo:

Os arquivos de áudio estão na taxa de amostragem de 24kHz.
O discurso é dividido em quebras de frase.
Ambos os textos originais e normalizados estão incluídos.
Informações contextuais (por exemplo, frases vizinhas) podem ser extraídas.
Expressões com ruído de fundo significativo são excluídas.

Documentação Adicional : Explore em Papers With Code
Homepage : http://www.openslr.org/60
Código-fonte : tfds.datasets.libritts.Builder
Versões :
- 1.0.1 (padrão): Sem notas de versão.
Tamanho do download : 78.42 GiB
Tamanho do conjunto de dados : 271.41 GiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :

Dividir	Exemplos
`'dev_clean'`	5.736
`'dev_other'`	4.613
`'test_clean'`	4.837
`'test_other'`	5.120
`'train_clean100'`	33.236
`'train_clean360'`	116.500
`'train_other500'`	205.044

Estrutura de recursos :

FeaturesDict({
    'chapter_id': int64,
    'id': string,
    'speaker_id': int64,
    'speech': Audio(shape=(None,), dtype=int64),
    'text_normalized': Text(shape=(), dtype=string),
    'text_original': Text(shape=(), dtype=string),
})

Documentação do recurso :

Característica	Classe	Forma	Tipo D
	RecursosDict
capítulo_id	tensor		int64
Eu iria	tensor		corda
speaker_id	tensor		int64
Fala	áudio	(Nenhum,)	int64
texto_normalizado	Texto		corda
text_original	Texto		corda

Chaves supervisionadas (consulte o documento as_supervised ): ('text_normalized', 'speech')
Figura ( tfds.show_examples ): Não compatível.
Exemplos ( tfds.as_dataframe ):

Citação :

@inproceedings{zen2019libritts,
  title = {LibriTTS: A Corpus Derived from LibriSpeech for Text-to-Speech},
  author = {H. Zen and V. Dang and R. Clark and Y. Zhang and R. J. Weiss and Y. Jia and Z. Chen and Y. Wu},
  booktitle = {Proc. Interspeech},
  month = sep,
  year = {2019},
  doi = {10.21437/Interspeech.2019-2441},
}

libretos Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

libretos