Эта страница была переведа с помощью Cloud Translation API.
Switch to English

voxforge

  • Описание :

VoxForge - это набор данных классификации языков. Он состоит из предоставленных пользователем аудиоклипов, представленных на веб-сайте. В этом выпуске собраны данные для 6 языков - английского, испанского, французского, немецкого, русского и итальянского. Поскольку веб-сайт постоянно обновляется, и для воспроизводимости этот выпуск содержит только записи, представленные до 01.01.2020. Образцы делятся между обучением, проверкой и тестированием, так что образцы от каждого выступающего принадлежат ровно одной группе.

  • Домашняя страница : http://www.voxforge.org/

  • Исходный код : tfds.audio.Voxforge

  • Версии :

    • 1.0.0 (по умолчанию): без примечаний к выпуску.
  • Размер загрузки : Unknown size

  • Размер набора данных : Unknown size

  • Инструкции по загрузке вручную : для этого набора данных необходимо вручную загрузить исходные данные в download_config.manual_dir (по умолчанию ~/tensorflow_datasets/downloads/manual/ ):
    VoxForge требует ручной загрузки аудиоархивов. Полный список архивов можно найти в https://storage.googleapis.com/tfds-data/downloads/voxforge/voxforge_urls.txt Его можно загрузить с помощью следующей команды: wget -i voxforge_urls.txt -x Обратите внимание, что загрузка и для локального построения набора данных требуется ~ 100 ГБ дискового пространства (но только ~ 60 ГБ будет использоваться постоянно).

  • Автоматическое кэширование ( документация ): неизвестно

  • Сплит :

Трещина Примеры
  • Особенности :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    'speaker_id': tf.string,
})
  • Контролируемые ключи (см. as_supervised doc ): ('audio', 'label')

  • Цитата :

@article{maclean2018voxforge,
  title={Voxforge},
  author={MacLean, Ken},
  journal={Ken MacLean.[Online]. Available: http://www.voxforge.org/home.[Acedido em 2012]},
  year={2018}
}