¡El Día de la Comunidad de ML es el 9 de noviembre! Únase a nosotros para recibir actualizaciones de TensorFlow, JAX, y más Más información

sí No

  • Descripción:

Sesenta grabaciones de un individuo diciendo sí o no en hebreo; cada grabación tiene ocho palabras.

El punto principal del conjunto de datos es proporcionar una forma fácil y rápida de probar los scripts de Kaldi de forma gratuita.

El archivo "waves_yesno.tar.gz" contiene 60 archivos .wav, muestreados a 8 kHz. Todos fueron grabados por el mismo hablante masculino, en hebreo. En cada archivo, el individuo dice 8 palabras; cada palabra es el hebreo para "sí" o "no", por lo que cada archivo es una secuencia aleatoria de 8 sí-es o no. No se proporciona una transcripción separada; la secuencia está codificada en el nombre del archivo, con 1 para sí y 0 para no.

Separar Ejemplos de
'train' 60
  • características:
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'audio/filename': Text(shape=(), dtype=tf.string),
    'label': Sequence(ClassLabel(shape=(), dtype=tf.int64, num_classes=2)),
})
  • Cita:
@ONLINE {YesNo,
    author = "Created for the Kaldi Project",
    title  = "YesNo",
    url    = "http://www.openslr.org/1/"
}