Google I/O — это обертка! Наверстать упущенное в сеансах TensorFlow Просмотреть сеансы

либритты

  • Описание:

LibriTTS - это корпус английского языка с несколькими говорящими на приблизительно 585 часов чтения английской речи с частотой дискретизации 24 кГц, подготовленный Хейга Дзен при содействии членов команды Google Speech и Google Brain. Корпус LibriTTS предназначен для исследования TTS. Он основан на исходных материалах (аудиофайлы в формате mp3 из LibriVox и текстовые файлы из Project Gutenberg) корпуса LibriSpeech. Основные отличия от корпуса LibriSpeech перечислены ниже:

  1. Аудио файлы имеют частоту дискретизации 24 кГц.
  2. Речь разбивается на перерывы в предложениях.
  3. Включены как оригинальные, так и нормализованные тексты.
  4. Контекстная информация (например, соседние предложения) может быть извлечена.
  5. Исключаются высказывания со значительным фоновым шумом.
  • Домашняя страница: http://www.openslr.org/60

  • Исходный код: tfds.audio.Libritts

  • Версии:

    • 1.0.1 ( по умолчанию): Нет Замечания к выпуску.
  • Скачать Размер: 78.42 GiB

  • Dataset Размер: 271.41 GiB

  • Авто-кэшируются ( документация ): Нет

  • расколы:

Расколоть Примеры
'dev_clean' 5736
'dev_other' 4 613
'test_clean' 4837
'test_other' 5 120
'train_clean100' 33 236
'train_clean360' 116 500
'train_other500' 205 044
  • Особенности:
FeaturesDict({
    'chapter_id': tf.int64,
    'id': tf.string,
    'speaker_id': tf.int64,
    'speech': Audio(shape=(None,), dtype=tf.int64),
    'text_normalized': Text(shape=(), dtype=tf.string),
    'text_original': Text(shape=(), dtype=tf.string),
})
  • Образец цитирования:
@inproceedings{zen2019libritts,
  title = {LibriTTS: A Corpus Derived from LibriSpeech for Text-to-Speech},
  author = {H. Zen and V. Dang and R. Clark and Y. Zhang and R. J. Weiss and Y. Jia and Z. Chen and Y. Wu},
  booktitle = {Proc. Interspeech},
  month = sep,
  year = {2019},
  doi = {10.21437/Interspeech.2019-2441},
}