- Описание:
LibriTTS - это корпус английского языка с несколькими говорящими на приблизительно 585 часов чтения английской речи с частотой дискретизации 24 кГц, подготовленный Хейга Дзен при содействии членов команды Google Speech и Google Brain. Корпус LibriTTS предназначен для исследования TTS. Он основан на исходных материалах (аудиофайлы в формате mp3 из LibriVox и текстовые файлы из Project Gutenberg) корпуса LibriSpeech. Основные отличия от корпуса LibriSpeech перечислены ниже:
- Аудио файлы имеют частоту дискретизации 24 кГц.
- Речь разбивается на перерывы в предложениях.
- Включены как оригинальные, так и нормализованные тексты.
- Контекстная информация (например, соседние предложения) может быть извлечена.
- Исключаются высказывания со значительным фоновым шумом.
Домашняя страница: http://www.openslr.org/60
Исходный код:
tfds.audio.Libritts
Версии:
-
1.0.1
( по умолчанию): Нет Замечания к выпуску.
-
Скачать Размер:
78.42 GiB
Dataset Размер:
271.41 GiB
Авто-кэшируются ( документация ): Нет
расколы:
Расколоть | Примеры |
---|---|
'dev_clean' | 5736 |
'dev_other' | 4 613 |
'test_clean' | 4837 |
'test_other' | 5 120 |
'train_clean100' | 33 236 |
'train_clean360' | 116 500 |
'train_other500' | 205 044 |
- Особенности:
FeaturesDict({
'chapter_id': tf.int64,
'id': tf.string,
'speaker_id': tf.int64,
'speech': Audio(shape=(None,), dtype=tf.int64),
'text_normalized': Text(shape=(), dtype=tf.string),
'text_original': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (См
as_supervised
документ ):('text_normalized', 'speech')
Рис ( tfds.show_examples ): Не поддерживается.
Примеры ( tfds.as_dataframe ):
- Образец цитирования:
@inproceedings{zen2019libritts,
title = {LibriTTS: A Corpus Derived from LibriSpeech for Text-to-Speech},
author = {H. Zen and V. Dang and R. Clark and Y. Zhang and R. J. Weiss and Y. Jia and Z. Chen and Y. Wu},
booktitle = {Proc. Interspeech},
month = sep,
year = {2019},
doi = {10.21437/Interspeech.2019-2441},
}