Эта страница была переведа с помощью Cloud Translation API.
Switch to English

voxceleb

  • Описание :

Большой набор данных для идентификации говорящего. Эти данные собраны у более чем 1251 говорящего, всего более 150 тысяч образцов. Этот выпуск содержит звуковую часть набора данных voxceleb1.1.

  • Домашняя страница : http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html

  • Исходный код : tfds.audio.Voxceleb

  • Версии :

    • 1.1.1 (по умолчанию): без примечаний к выпуску.
  • Размер загрузки : 4.68 MiB

  • Размер набора данных : 107.97 GiB

  • Инструкции по загрузке вручную : для этого набора данных необходимо вручную загрузить исходные данные в download_config.manual_dir (по умолчанию ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir должен содержать файл vox_dev_wav.zip. Инструкции по загрузке этого файла находятся на http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html. Этот набор данных требует регистрации.

  • Автоматическое кэширование ( документация ): Нет

  • Сплит :

Трещина Примеры
'test' 7 972
'train' 134 000
'validation' 6 670
  • Особенности :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=1252),
})
  • Контролируемые ключи (см. as_supervised doc ): ('audio', 'label')

  • Цитата :

@InProceedings{Nagrani17,
    author       = "Nagrani, A. and Chung, J.~S. and Zisserman, A.",
    title        = "VoxCeleb: a large-scale speaker identification dataset",
    booktitle    = "INTERSPEECH",
    year         = "2017",
}