- Описание :
Этот корпус CSTR VCTK включает речевые данные, произнесенные 110 носителями английского языка с различными акцентами. Каждый выступающий зачитывает около 400 предложений, которые были выбраны из газеты, радужного отрывка и параграфа для извлечения, использованного для архива речевого акцента.
Обратите внимание, что текст «p315» был потерян из-за ошибки жесткого диска.
Домашняя страница : https://doi.org/10.7488/ds/2645
Исходный код :
tfds.audio.Vctk
Версии :
-
1.0.0
(по умолчанию): VCTK версии 0.92.0.
-
Размер загружаемого
10.94 GiB
:10.94 GiB
Автоматическое кэширование ( документация ): Нет
Особенности :
FeaturesDict({
'accent': ClassLabel(shape=(), dtype=tf.int64, num_classes=13),
'gender': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
'id': tf.string,
'speaker': ClassLabel(shape=(), dtype=tf.int64, num_classes=110),
'speech': Audio(shape=(None,), dtype=tf.int64),
'text': Text(shape=(), dtype=tf.string),
})
Контролируемые ключи (см.
as_supervised
doc ):('text', 'speech')
Цитата :
@misc{yamagishi2019vctk,
author={Yamagishi, Junichi and Veaux, Christophe and MacDonald, Kirsten},
title={ {CSTR VCTK Corpus}: English Multi-speaker Corpus for {CSTR} Voice Cloning Toolkit (version 0.92)},
publisher={University of Edinburgh. The Centre for Speech Technology Research (CSTR)},
year=2019,
doi={10.7488/ds/2645},
}
- Рисунок ( tfds.show_examples ): не поддерживается.
vctk / mic1 (конфигурация по умолчанию)
Описание конфигурации : звук записан с помощью всенаправленного микрофона (DPA 4035). Содержит шумы очень низкой частоты.
This is the same audio released in previous versions of VCTK: https://doi.org/10.7488/ds/1994
Размер набора данных :
39.87 GiB
Сплит :
Трещина | Примеры |
---|---|
'train' | 44 455 |
- Примеры ( tfds.as_dataframe ):
vctk / mic2
Описание конфигурации : звук, записанный с помощью конденсаторного микрофона с небольшой диафрагмой и очень широкой полосой пропускания (Sennheiser MKH 800).
Two speakers, p280 and p315 had technical issues of the audio recordings using MKH 800.
Размер набора данных :
38.86 GiB
Сплит :
Трещина | Примеры |
---|---|
'train' | 43 873 |
- Примеры ( tfds.as_dataframe ):