Эта страница была переведа с помощью Cloud Translation API.
Switch to English

vctk

  • Описание :

Этот корпус CSTR VCTK включает речевые данные, произнесенные 110 носителями английского языка с различными акцентами. Каждый оратор зачитывает около 400 предложений, которые были выбраны из газеты, радужного отрывка и параграфа для извлечения, использованного для архива речевого акцента.

Обратите внимание, что текст «p315» был потерян из-за ошибки жесткого диска.

  • Домашняя страница : https://doi.org/10.7488/ds/2645

  • Исходный код : tfds.audio.Vctk

  • Версии :

    • 1.0.0 (по умолчанию): без примечаний к выпуску.
  • Размер загружаемого 10.94 GiB : 10.94 GiB

  • Автоматическое кэширование ( документация ): Нет

  • Особенности :

FeaturesDict({
    'accent': ClassLabel(shape=(), dtype=tf.int64, num_classes=13),
    'gender': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'id': tf.string,
    'speaker': ClassLabel(shape=(), dtype=tf.int64, num_classes=110),
    'speech': Audio(shape=(None,), dtype=tf.int64),
    'text': Text(shape=(), dtype=tf.string),
})
  • Контролируемые ключи (см. as_supervised doc ): ('text', 'speech')

  • Цитата :

@misc{yamagishi2019vctk,
  author={Yamagishi, Junichi and Veaux, Christophe and MacDonald, Kirsten},
  title={ {CSTR VCTK Corpus}: English Multi-speaker Corpus for {CSTR} Voice Cloning Toolkit (version 0.92)},
  publisher={University of Edinburgh. The Centre for Speech Technology Research (CSTR)},
  year=2019,
  doi={10.7488/ds/2645},
}

vctk / mic1 (конфигурация по умолчанию)

  • Описание конфигурации : звук записан с помощью всенаправленного микрофона (DPA 4035). Содержит шумы очень низкой частоты.

          This is the same audio released in previous versions of VCTK:
          <a href="https://doi.org/10.7488/ds/1994">https://doi.org/10.7488/ds/1994</a>
    
  • Размер набора данных : 39.87 GiB

  • Сплит :

Трещина Примеры
'train' 44 455

vctk / mic2

  • Описание конфигурации : звук, записанный с помощью конденсаторного микрофона с небольшой диафрагмой и очень широкой полосой пропускания (Sennheiser MKH 800).
      Two speakers, p280 and p315 had technical issues of the audio
      recordings using MKH 800.
  • Размер набора данных : 38.86 GiB

  • Сплит :

Трещина Примеры
'train' 43 873