- Описание:
VoxForge - это набор данных классификации языков. Он состоит из предоставленных пользователем аудиоклипов, представленных на веб-сайте. В этом выпуске собраны данные для 6 языков - английского, испанского, французского, немецкого, русского и итальянского. Поскольку веб-сайт постоянно обновляется и для воспроизводимости, этот выпуск содержит только записи, представленные до 01.01.2020. Выборки разделяются между обучением, проверкой и тестированием, так что образцы от каждого выступающего принадлежат ровно одной группе.
Домашняя страница: http://www.voxforge.org/
Исходный код:
tfds.audio.Voxforge
Версии:
-
1.0.0
( по умолчанию): Нет Замечания к выпуску.
-
Размер загрузки:
Unknown size
Dataset размер:
Unknown size
Руководство по эксплуатации скачать: Этот набор данных требует от вас , чтобы загрузить исходные данные вручную в
download_config.manual_dir
( по умолчанию~/tensorflow_datasets/downloads/manual/
):
VoxForge требует ручной загрузки аудиоархивов. Полный список архивов можно найти в https://storage.googleapis.com/tfds-data/downloads/voxforge/voxforge_urls.txt Его можно загрузить с помощью следующей команды: Wget -i voxforge_urls.txt -x Обратите внимание , что загрузка и для локального построения набора данных требуется ~ 100 ГБ дискового пространства (но только ~ 60 ГБ будет использоваться постоянно).Авто-кэшируются ( документация ): Unknown
расколы:
Расколоть | Примеры |
---|
- Особенности:
FeaturesDict({
'audio': Audio(shape=(None,), dtype=tf.int64),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
'speaker_id': tf.string,
})
Контролируемые ключи (см
as_supervised
документ ):('audio', 'label')
Рис ( tfds.show_examples ): Не поддерживается.
Примеры ( tfds.as_dataframe ): Отсутствует.
Образец цитирования:
@article{maclean2018voxforge,
title={Voxforge},
author={MacLean, Ken},
journal={Ken MacLean.[Online]. Available: http://www.voxforge.org/home.[Acedido em 2012]},
year={2018}
}