librisdiscours

  • Description:

LibriSpeech est un corpus d'environ 1000 heures de parole en anglais lu avec un taux d'échantillonnage de 16 kHz, préparé par Vassil Panayotov avec l'aide de Daniel Povey. Les données sont dérivées de livres audio lus du projet LibriVox et ont été soigneusement segmentées et alignées87.

Diviser Exemples
'dev_clean' 2 703
'dev_other' 2 864
'test_clean' 2 620
'test_other' 2 939
'train_clean100' 28 539
'train_clean360' 104 014
'train_other500' 148 688
  • Caractéristiques:
FeaturesDict({
    'chapter_id': tf.int64,
    'id': tf.string,
    'speaker_id': tf.int64,
    'speech': Audio(shape=(None,), dtype=tf.int64),
    'text': Text(shape=(), dtype=tf.string),
})
  • citation:
@inproceedings{panayotov2015librispeech,
  title={Librispeech: an ASR corpus based on public domain audio books},
  author={Panayotov, Vassil and Chen, Guoguo and Povey, Daniel and Khudanpur, Sanjeev},
  booktitle={Acoustics, Speech and Signal Processing (ICASSP), 2015 IEEE International Conference on},
  pages={5206--5210},
  year={2015},
  organization={IEEE}
}