- Описание:
Набор данных общего голоса Mozilla
Домашняя страница: https://voice.mozilla.org/en/datasets
Исходный код:
tfds.audio.CommonVoice
Версии:
-
1.0.0
( по умолчанию): Нет Замечания к выпуску.
-
Размер загрузки:
Unknown size
Dataset размер:
Unknown size
Авто-кэшируются ( документация ): Unknown
расколы:
Расколоть | Примеры |
---|
Контролируемые ключи (см
as_supervised
документ ):None
Рис ( tfds.show_examples ): Не поддерживается.
Примеры ( tfds.as_dataframe ): Отсутствует.
Образец цитирования:
common_voice / en (конфигурация по умолчанию)
Config Описание: Код языка: EN
Особенности:
FeaturesDict({
'accent': ClassLabel(shape=(), dtype=tf.int64, num_classes=17),
'age': Text(shape=(), dtype=tf.string),
'client_id': Text(shape=(), dtype=tf.string),
'downvotes': tf.int32,
'gender': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'sentence': Text(shape=(), dtype=tf.string),
'upvotes': tf.int32,
'voice': Audio(shape=(None,), dtype=tf.int64),
})
common_voice / de
Описание конфигурации: Код языка: де
Особенности:
FeaturesDict({
'accent': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
'age': Text(shape=(), dtype=tf.string),
'client_id': Text(shape=(), dtype=tf.string),
'downvotes': tf.int32,
'gender': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'sentence': Text(shape=(), dtype=tf.string),
'upvotes': tf.int32,
'voice': Audio(shape=(None,), dtype=tf.int64),
})
common_voice / fr
Описание конфигурации: Код языка: пт
Особенности:
FeaturesDict({
'accent': ClassLabel(shape=(), dtype=tf.int64, num_classes=19),
'age': Text(shape=(), dtype=tf.string),
'client_id': Text(shape=(), dtype=tf.string),
'downvotes': tf.int32,
'gender': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'sentence': Text(shape=(), dtype=tf.string),
'upvotes': tf.int32,
'voice': Audio(shape=(None,), dtype=tf.int64),
})
common_voice / cy
Описание конфигурации: Код языка: ТиЦ
Особенности:
FeaturesDict({
'accent': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
'age': Text(shape=(), dtype=tf.string),
'client_id': Text(shape=(), dtype=tf.string),
'downvotes': tf.int32,
'gender': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'sentence': Text(shape=(), dtype=tf.string),
'upvotes': tf.int32,
'voice': Audio(shape=(None,), dtype=tf.int64),
})
common_voice / br
Описание конфигурации: Код языка: уш
Особенности:
FeaturesDict({
'accent': ClassLabel(shape=(), dtype=tf.int64, num_classes=1),
'age': Text(shape=(), dtype=tf.string),
'client_id': Text(shape=(), dtype=tf.string),
'downvotes': tf.int32,
'gender': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'sentence': Text(shape=(), dtype=tf.string),
'upvotes': tf.int32,
'voice': Audio(shape=(None,), dtype=tf.int64),
})
common_voice / cv
Описание конфигурации: Код языка: резюме
Особенности:
FeaturesDict({
'accent': ClassLabel(shape=(), dtype=tf.int64, num_classes=0),
'age': Text(shape=(), dtype=tf.string),
'client_id': Text(shape=(), dtype=tf.string),
'downvotes': tf.int32,
'gender': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'sentence': Text(shape=(), dtype=tf.string),
'upvotes': tf.int32,
'voice': Audio(shape=(None,), dtype=tf.int64),
})
common_voice / tr
Описание конфигурации: Код языка: тр
Особенности:
FeaturesDict({
'accent': ClassLabel(shape=(), dtype=tf.int64, num_classes=1),
'age': Text(shape=(), dtype=tf.string),
'client_id': Text(shape=(), dtype=tf.string),
'downvotes': tf.int32,
'gender': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'sentence': Text(shape=(), dtype=tf.string),
'upvotes': tf.int32,
'voice': Audio(shape=(None,), dtype=tf.int64),
})
common_voice / tt
Описание конфигурации: Код языка: тт
Особенности:
FeaturesDict({
'accent': ClassLabel(shape=(), dtype=tf.int64, num_classes=0),
'age': Text(shape=(), dtype=tf.string),
'client_id': Text(shape=(), dtype=tf.string),
'downvotes': tf.int32,
'gender': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'sentence': Text(shape=(), dtype=tf.string),
'upvotes': tf.int32,
'voice': Audio(shape=(None,), dtype=tf.int64),
})
common_voice / ky
Config Описание: Код языка: KY
Особенности:
FeaturesDict({
'accent': ClassLabel(shape=(), dtype=tf.int64, num_classes=1),
'age': Text(shape=(), dtype=tf.string),
'client_id': Text(shape=(), dtype=tf.string),
'downvotes': tf.int32,
'gender': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'sentence': Text(shape=(), dtype=tf.string),
'upvotes': tf.int32,
'voice': Audio(shape=(None,), dtype=tf.int64),
})
common_voice / ga-IE
Описание настроек: Код языка: га-IE
Особенности:
FeaturesDict({
'accent': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'age': Text(shape=(), dtype=tf.string),
'client_id': Text(shape=(), dtype=tf.string),
'downvotes': tf.int32,
'gender': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'sentence': Text(shape=(), dtype=tf.string),
'upvotes': tf.int32,
'voice': Audio(shape=(None,), dtype=tf.int64),
})
common_voice / kab
Описание конфигурации: Код языка: каб
Особенности:
FeaturesDict({
'accent': ClassLabel(shape=(), dtype=tf.int64, num_classes=1),
'age': Text(shape=(), dtype=tf.string),
'client_id': Text(shape=(), dtype=tf.string),
'downvotes': tf.int32,
'gender': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'sentence': Text(shape=(), dtype=tf.string),
'upvotes': tf.int32,
'voice': Audio(shape=(None,), dtype=tf.int64),
})
common_voice / ca
Описание конфигурации: Код языка: ок
Особенности:
FeaturesDict({
'accent': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
'age': Text(shape=(), dtype=tf.string),
'client_id': Text(shape=(), dtype=tf.string),
'downvotes': tf.int32,
'gender': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'sentence': Text(shape=(), dtype=tf.string),
'upvotes': tf.int32,
'voice': Audio(shape=(None,), dtype=tf.int64),
})
common_voice / zh-TW
Описание конфигурации: Код языка: ZH-TW
Особенности:
FeaturesDict({
'accent': ClassLabel(shape=(), dtype=tf.int64, num_classes=1),
'age': Text(shape=(), dtype=tf.string),
'client_id': Text(shape=(), dtype=tf.string),
'downvotes': tf.int32,
'gender': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'sentence': Text(shape=(), dtype=tf.string),
'upvotes': tf.int32,
'voice': Audio(shape=(None,), dtype=tf.int64),
})
common_voice / sl
Описание конфигурации: Код языка: С.Л.
Особенности:
FeaturesDict({
'accent': ClassLabel(shape=(), dtype=tf.int64, num_classes=1),
'age': Text(shape=(), dtype=tf.string),
'client_id': Text(shape=(), dtype=tf.string),
'downvotes': tf.int32,
'gender': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'sentence': Text(shape=(), dtype=tf.string),
'upvotes': tf.int32,
'voice': Audio(shape=(None,), dtype=tf.int64),
})
common_voice / it
Config Описание: Код языка: это
Особенности:
FeaturesDict({
'accent': ClassLabel(shape=(), dtype=tf.int64, num_classes=1),
'age': Text(shape=(), dtype=tf.string),
'client_id': Text(shape=(), dtype=tf.string),
'downvotes': tf.int32,
'gender': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'sentence': Text(shape=(), dtype=tf.string),
'upvotes': tf.int32,
'voice': Audio(shape=(None,), dtype=tf.int64),
})
common_voice / nl
Описание конфигурации: Код языка: нл
Особенности:
FeaturesDict({
'accent': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'age': Text(shape=(), dtype=tf.string),
'client_id': Text(shape=(), dtype=tf.string),
'downvotes': tf.int32,
'gender': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'sentence': Text(shape=(), dtype=tf.string),
'upvotes': tf.int32,
'voice': Audio(shape=(None,), dtype=tf.int64),
})
common_voice / cnh
Config Описание: Код языка: CNH
Особенности:
FeaturesDict({
'accent': ClassLabel(shape=(), dtype=tf.int64, num_classes=1),
'age': Text(shape=(), dtype=tf.string),
'client_id': Text(shape=(), dtype=tf.string),
'downvotes': tf.int32,
'gender': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'sentence': Text(shape=(), dtype=tf.string),
'upvotes': tf.int32,
'voice': Audio(shape=(None,), dtype=tf.int64),
})
common_voice / eo
Описание конфигурации: Код языка: ео
Особенности:
FeaturesDict({
'accent': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
'age': Text(shape=(), dtype=tf.string),
'client_id': Text(shape=(), dtype=tf.string),
'downvotes': tf.int32,
'gender': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'sentence': Text(shape=(), dtype=tf.string),
'upvotes': tf.int32,
'voice': Audio(shape=(None,), dtype=tf.int64),
})