- Descripción:
Sesenta grabaciones de un individuo diciendo sí o no en hebreo; cada grabación tiene ocho palabras.
El punto principal del conjunto de datos es proporcionar una forma fácil y rápida de probar los scripts de Kaldi de forma gratuita.
El archivo "waves_yesno.tar.gz" contiene 60 archivos .wav, muestreados a 8 kHz. Todos fueron grabados por el mismo hablante masculino, en hebreo. En cada archivo, el individuo dice 8 palabras; cada palabra es el hebreo para "sí" o "no", por lo que cada archivo es una secuencia aleatoria de 8 sí-es o no. No se proporciona una transcripción separada; la secuencia está codificada en el nombre del archivo, con 1 para sí y 0 para no.
Inicio: https://www.openslr.org/1/
El código fuente:
tfds.audio.yesno.YesNo
versiones:
-
1.0.0
(por defecto): No hay notas de la versión.
-
Tamaño del paquete:
4.49 MiB
Conjunto de datos de tamaño:
16.27 MiB
Auto-caché ( documentación ): Sí
Fraccionamientos:
Separar | Ejemplos de |
---|---|
'train' | 60 |
- características:
FeaturesDict({
'audio': Audio(shape=(None,), dtype=tf.int64),
'audio/filename': Text(shape=(), dtype=tf.string),
'label': Sequence(ClassLabel(shape=(), dtype=tf.int64, num_classes=2)),
})
Claves supervisadas (Ver
as_supervised
doc ):('audio', 'label')
Figura ( tfds.show_examples ): No soportado.
Ejemplos ( tfds.as_dataframe ):
- Cita:
@ONLINE {YesNo,
author = "Created for the Kaldi Project",
title = "YesNo",
url = "http://www.openslr.org/1/"
}