- Описание :
LibriSpeech — это корпус из примерно 1000 часов прочитанной английской речи с частотой дискретизации 16 кГц, подготовленный Василом Панайотовым при содействии Дэниела Пови. Данные получены из прочитанных аудиокниг в рамках проекта LibriVox и тщательно сегментированы и согласованы.
Домашняя страница : http://www.openslr.org/12
Исходный код :
tfds.audio.Librispeech
Версии :
-
2.1.0
(по умолчанию): нет примечаний к выпуску.
-
Размер загрузки :
57.14 GiB
Размер набора данных :
304.47 GiB
.Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'dev_clean' | 2703 |
'dev_other' | 2864 |
'test_clean' | 2620 |
'test_other' | 2939 |
'train_clean100' | 28 539 |
'train_clean360' | 104 014 |
'train_other500' | 148 688 |
- Структура функции :
FeaturesDict({
'chapter_id': tf.int64,
'id': tf.string,
'speaker_id': tf.int64,
'speech': Audio(shape=(None,), dtype=tf.int64),
'text': Text(shape=(), dtype=tf.string),
})
- Документация по функциям :
Характерная черта | Класс | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
id_главы | Тензор | tf.int64 | ||
я бы | Тензор | tf.string | ||
спикер_ид | Тензор | tf.int64 | ||
речь | Аудио | (Никто,) | tf.int64 | |
текст | Текст | tf.string |
Контролируемые ключи (см.
as_supervised
doc ):('speech', 'text')
Рисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ):
- Цитата :
@inproceedings{panayotov2015librispeech,
title={Librispeech: an ASR corpus based on public domain audio books},
author={Panayotov, Vassil and Chen, Guoguo and Povey, Daniel and Khudanpur, Sanjeev},
booktitle={Acoustics, Speech and Signal Processing (ICASSP), 2015 IEEE International Conference on},
pages={5206--5210},
year={2015},
organization={IEEE}
}