ljdiscours

  • Description:

Il s'agit d'un ensemble de données vocales du domaine public composé de 13 100 courts clips audio d'un seul locuteur lisant des passages de 7 livres de non-fiction. Une transcription est fournie pour chaque clip. Les clips varient en longueur de 1 à 10 secondes et ont une durée totale d'environ 24 heures.

Les textes ont été publiés entre 1884 et 1964, et sont dans le domaine public. L'audio a été enregistré en 2016-17 par le projet LibriVox et est également dans le domaine public.

Diviser Exemples
'train' 13.100
  • Caractéristiques:
FeaturesDict({
    'id': tf.string,
    'speech': Audio(shape=(None,), dtype=tf.int64),
    'text': Text(shape=(), dtype=tf.string),
    'text_normalized': Text(shape=(), dtype=tf.string),
})
  • citation:
@misc{ljspeech17,
  author       = {Keith Ito},
  title        = {The LJ Speech Dataset},
  howpublished = {\url{https://keithito.com/LJ-Speech-Dataset/} },
  year         = 2017
}