Halaman ini diterjemahkan oleh Cloud Translation API.
Switch to English

librispeech

  • Deskripsi :

LibriSpeech adalah kumpulan sekitar 1000 jam pidato bahasa Inggris dengan kecepatan sampling 16 kHz, yang disiapkan oleh Vassil Panayotov dengan bantuan Daniel Povey. Data tersebut berasal dari buku audio baca dari proyek LibriVox, dan telah tersegmentasi dan diselaraskan dengan hati-hati.87

Membagi Contoh
'dev_clean' 2.703
'dev_other' 2.864
'test_clean' 2.620
'test_other' 2.939
'train_clean100' 28.539
'train_clean360' 104.014
'train_other500' 148.688
  • Fitur :
FeaturesDict({
    'chapter_id': tf.int64,
    'id': tf.string,
    'speaker_id': tf.int64,
    'speech': Audio(shape=(None,), dtype=tf.int64),
    'text': Text(shape=(), dtype=tf.string),
})
@inproceedings{panayotov2015librispeech,
  title={Librispeech: an ASR corpus based on public domain audio books},
  author={Panayotov, Vassil and Chen, Guoguo and Povey, Daniel and Khudanpur, Sanjeev},
  booktitle={Acoustics, Speech and Signal Processing (ICASSP), 2015 IEEE International Conference on},
  pages={5206--5210},
  year={2015},
  organization={IEEE}
}