либритты

Описание :

LibriTTS — это англоязычный корпус, содержащий около 585 часов чтения английской речи с частотой дискретизации 24 кГц, подготовленный Heiga Zen при содействии членов команды Google Speech и Google Brain. Корпус LibriTTS предназначен для исследований TTS. Он основан на исходных материалах (аудиофайлы mp3 от LibriVox и текстовые файлы от Project Gutenberg) корпуса LibriSpeech. Основные отличия от корпуса LibriSpeech перечислены ниже:

Аудиофайлы имеют частоту дискретизации 24 кГц.
Речь разбивается на разрывы предложений.
Включены как оригинальные, так и нормализованные тексты.
Контекстная информация (например, соседние предложения) может быть извлечена.
Исключаются высказывания со значительным фоновым шумом.

Дополнительная документация : изучить документы с кодом
Домашняя страница : http://www.openslr.org/60
Исходный код : tfds.datasets.libritts.Builder
Версии :
- 1.0.1 (по умолчанию): нет примечаний к выпуску.
Размер загрузки : 78.42 GiB
Размер набора данных : 271.41 GiB
Автоматическое кэширование ( документация ): Нет
Сплиты :

Расколоть	Примеры
`'dev_clean'`	5736
`'dev_other'`	4613
`'test_clean'`	4837
`'test_other'`	5120
`'train_clean100'`	33 236
`'train_clean360'`	116 500
`'train_other500'`	205 044

Структура функции :

FeaturesDict({
    'chapter_id': int64,
    'id': string,
    'speaker_id': int64,
    'speech': Audio(shape=(None,), dtype=int64),
    'text_normalized': Text(shape=(), dtype=string),
    'text_original': Text(shape=(), dtype=string),
})

Документация по функциям :

Особенность	Учебный класс	Форма	Dтип
	ОсобенностиDict
id_главы	Тензор		int64
я бы	Тензор		нить
спикер_ид	Тензор		int64
речь	Аудио	(Никто,)	int64
text_normalized	Текст		нить
text_original	Текст		нить

Контролируемые ключи (см. документ as_supervised ): ('text_normalized', 'speech')
Рисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ):

Цитата :

@inproceedings{zen2019libritts,
  title = {LibriTTS: A Corpus Derived from LibriSpeech for Text-to-Speech},
  author = {H. Zen and V. Dang and R. Clark and Y. Zhang and R. J. Weiss and Y. Jia and Z. Chen and Y. Wu},
  booktitle = {Proc. Interspeech},
  month = sep,
  year = {2019},
  doi = {10.21437/Interspeech.2019-2441},
}

либритты Оптимизируйте свои подборки Сохраняйте и классифицируйте контент в соответствии со своими настройками.

либритты