Google I/O — это обертка! Наверстать упущенное в сеансах TensorFlow Просмотреть сеансы

voxforge

  • Описание:

VoxForge - это набор данных классификации языков. Он состоит из предоставленных пользователем аудиоклипов, представленных на веб-сайте. В этом выпуске собраны данные для 6 языков - английского, испанского, французского, немецкого, русского и итальянского. Поскольку веб-сайт постоянно обновляется и для воспроизводимости, этот выпуск содержит только записи, представленные до 01.01.2020. Выборки разделяются между обучением, проверкой и тестированием, так что образцы от каждого выступающего принадлежат ровно одной группе.

  • Домашняя страница: http://www.voxforge.org/

  • Исходный код: tfds.audio.Voxforge

  • Версии:

    • 1.0.0 ( по умолчанию): Нет Замечания к выпуску.
  • Размер загрузки: Unknown size

  • Dataset размер: Unknown size

  • Руководство по эксплуатации скачать: Этот набор данных требует от вас , чтобы загрузить исходные данные вручную в download_config.manual_dir ( по умолчанию ~/tensorflow_datasets/downloads/manual/ ):
    VoxForge требует ручной загрузки аудиоархивов. Полный список архивов можно найти в https://storage.googleapis.com/tfds-data/downloads/voxforge/voxforge_urls.txt Его можно загрузить с помощью следующей команды: Wget -i voxforge_urls.txt -x Обратите внимание , что загрузка и для локального построения набора данных требуется ~ 100 ГБ дискового пространства (но только ~ 60 ГБ будет использоваться постоянно).

  • Авто-кэшируются ( документация ): Unknown

  • расколы:

Расколоть Примеры
  • Особенности:
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    'speaker_id': tf.string,
})
@article{maclean2018voxforge,
  title={Voxforge},
  author={MacLean, Ken},
  journal={Ken MacLean.[Online]. Available: http://www.voxforge.org/home.[Acedido em 2012]},
  year={2018}
}