- Descripción:
LibriTTS es un corpus de inglés de varios hablantes de aproximadamente 585 horas de lectura de habla en inglés a una frecuencia de muestreo de 24 kHz, preparado por Heiga Zen con la ayuda de los miembros del equipo de Google Speech y Google Brain. El corpus LibriTTS está diseñado para la investigación de TTS. Se deriva de los materiales originales (archivos de audio mp3 de LibriVox y archivos de texto del Proyecto Gutenberg) del corpus LibriSpeech. Las principales diferencias con el corpus LibriSpeech se enumeran a continuación:
- Los archivos de audio tienen una frecuencia de muestreo de 24 kHz.
- El discurso se divide en los descansos de las oraciones.
- Se incluyen tanto textos originales como normalizados.
- Se puede extraer información contextual (por ejemplo, oraciones vecinas).
- Se excluyen las declaraciones con ruido de fondo significativo.
Inicio: http://www.openslr.org/60
El código fuente:
tfds.audio.Libritts
versiones:
-
1.0.1
(por defecto): No hay notas de la versión.
-
Tamaño del paquete:
78.42 GiB
Tamaño de conjunto de datos:
271.41 GiB
Auto-caché ( documentación ): No
Fraccionamientos:
Separar | Ejemplos de |
---|---|
'dev_clean' | 5.736 |
'dev_other' | 4.613 |
'test_clean' | 4.837 |
'test_other' | 5.120 |
'train_clean100' | 33,236 |
'train_clean360' | 116,500 |
'train_other500' | 205,044 |
- características:
FeaturesDict({
'chapter_id': tf.int64,
'id': tf.string,
'speaker_id': tf.int64,
'speech': Audio(shape=(None,), dtype=tf.int64),
'text_normalized': Text(shape=(), dtype=tf.string),
'text_original': Text(shape=(), dtype=tf.string),
})
Claves supervisadas (Ver
as_supervised
doc ):('text_normalized', 'speech')
Figura ( tfds.show_examples ): No soportado.
Ejemplos ( tfds.as_dataframe ):
- Cita:
@inproceedings{zen2019libritts,
title = {LibriTTS: A Corpus Derived from LibriSpeech for Text-to-Speech},
author = {H. Zen and V. Dang and R. Clark and Y. Zhang and R. J. Weiss and Y. Jia and Z. Chen and Y. Wu},
booktitle = {Proc. Interspeech},
month = sep,
year = {2019},
doi = {10.21437/Interspeech.2019-2441},
}