Эта страница была переведа с помощью Cloud Translation API.
Switch to English

librispeech

  • Описание :

LibriSpeech - это корпус из примерно 1000 часов чтения английской речи с частотой дискретизации 16 кГц, подготовленный Василом Панайотовым при содействии Дэниела Пови. Данные получены из аудиокниг, прочитанных в проекте LibriVox, и были тщательно сегментированы и выровнены.87

  • Домашняя страница : http://www.openslr.org/12

  • Исходный код : tfds.audio.Librispeech

  • Версии :

    • 1.1.0 (по умолчанию): без примечаний к выпуску.
  • Размер загружаемого 57.14 GiB : 57.14 GiB

  • Автоматическое кэширование ( документация ): Нет

  • Сплит :

Трещина Примеры
'dev_clean' 2 703
'dev_other' 2 864
'test_clean' 2 620
'test_other' 2 939
'train_clean100' 28 539
'train_clean360' 104 014
'train_other500' 148 688
  • Контролируемые ключи (см. as_supervised doc ): ('speech', 'text')

  • Цитата :

@inproceedings{panayotov2015librispeech,
  title={Librispeech: an ASR corpus based on public domain audio books},
  author={Panayotov, Vassil and Chen, Guoguo and Povey, Daniel and Khudanpur, Sanjeev},
  booktitle={Acoustics, Speech and Signal Processing (ICASSP), 2015 IEEE International Conference on},
  pages={5206--5210},
  year={2015},
  organization={IEEE}
}

librispeech / plain_text (конфигурация по умолчанию)

  • Описание конфигурации : Транскрипция в виде обычного текста.

  • Размер набора данных : 304.47 GiB

  • Особенности :

FeaturesDict({
    'chapter_id': tf.int64,
    'id': tf.string,
    'speaker_id': tf.int64,
    'speech': Audio(shape=(None,), dtype=tf.int64),
    'text': Text(shape=(), dtype=tf.string),
})

librispeech / subwords8k

  • Описание конфигурации : Транскрипции используют SubwordTextEncoder

  • Размер набора данных : 304.44 GiB

  • Особенности :

FeaturesDict({
    'chapter_id': tf.int64,
    'id': tf.string,
    'speaker_id': tf.int64,
    'speech': Audio(shape=(None,), dtype=tf.int64),
    'text': Text(shape=(None,), dtype=tf.int64, encoder=<SubwordTextEncoder vocab_size=8215>),
})

librispeech / subwords32k

  • Описание конфигурации : Транскрипции используют SubwordTextEncoder

  • Размер набора данных : 304.44 GiB

  • Особенности :

FeaturesDict({
    'chapter_id': tf.int64,
    'id': tf.string,
    'speaker_id': tf.int64,
    'speech': Audio(shape=(None,), dtype=tf.int64),
    'text': Text(shape=(None,), dtype=tf.int64, encoder=<SubwordTextEncoder vocab_size=32550>),
})