- Описание :
LibriTTS - это корпус английского языка с несколькими говорящими на приблизительно 585 часов чтения английской речи с частотой дискретизации 24 кГц, подготовленный Хейга Дзен при содействии членов команды Google Speech и Google Brain. Корпус LibriTTS предназначен для исследования TTS. Он основан на исходных материалах (аудиофайлы в формате mp3 из LibriVox и текстовые файлы из Project Gutenberg) корпуса LibriSpeech. Основные отличия от корпуса LibriSpeech перечислены ниже:
- Аудио файлы имеют частоту дискретизации 24 кГц.
- Речь разбивается на разрыв предложения.
- Включены как оригинальные, так и нормализованные тексты.
- Контекстная информация (например, соседние предложения) может быть извлечена.
- Исключаются высказывания со значительным фоновым шумом.
Домашняя страница : http://www.openslr.org/60
Исходный код :
tfds.audio.Libritts
Версии :
-
1.0.1
(по умолчанию): без примечаний к выпуску.
-
Размер
78.42 GiB
:78.42 GiB
Размер набора данных :
271.41 GiB
Автоматическое кэширование ( документация ): Нет
Сплит :
Трещина | Примеры |
---|---|
'dev_clean' | 5736 |
'dev_other' | 4 613 |
'test_clean' | 4 837 |
'test_other' | 5 120 |
'train_clean100' | 33 236 |
'train_clean360' | 116 500 |
'train_other500' | 205 044 |
- Особенности :
FeaturesDict({
'chapter_id': tf.int64,
'id': tf.string,
'speaker_id': tf.int64,
'speech': Audio(shape=(None,), dtype=tf.int64),
'text_normalized': Text(shape=(), dtype=tf.string),
'text_original': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см.
as_supervised
):('text_normalized', 'speech')
Цитата :
@inproceedings{zen2019libritts,
title = {LibriTTS: A Corpus Derived from LibriSpeech for Text-to-Speech},
author = {H. Zen and V. Dang and R. Clark and Y. Zhang and R. J. Weiss and Y. Jia and Z. Chen and Y. Wu},
booktitle = {Proc. Interspeech},
month = sep,
year = {2019},
doi = {10.21437/Interspeech.2019-2441},
}
Рисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ):