librispeech

  • Açıklama :

LibriSpeech, Daniel Povey'in yardımıyla Vassil Panayotov tarafından hazırlanan, 16 kHz örnekleme hızına sahip, yaklaşık 1000 saatlik okuma İngilizce konuşmanın bir bütünüdür. Veriler, LibriVox projesinden okunan sesli kitaplardan türetilmiştir ve dikkatlice bölümlere ayrılmış ve hizalanmıştır.

Bölmek Örnekler
'dev_clean' 2.703
'dev_other' 2.864
'test_clean' 2.620
'test_other' 2.939
'train_clean100' 28.539
'train_clean360' 104.014
'train_other500' 148.688
  • Özellik yapısı :
FeaturesDict({
    'chapter_id': tf.int64,
    'id': tf.string,
    'speaker_id': tf.int64,
    'speech': Audio(shape=(None,), dtype=tf.int64),
    'text': Text(shape=(), dtype=tf.string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtype Tanım
ÖzelliklerDict
bölüm_kimliği tensör tf.int64
İD tensör tf.string
hoparlör_kimliği tensör tf.int64
konuşma Ses (Hiçbiri,) tf.int64
metin Metin tf.string
  • alıntı :
@inproceedings{panayotov2015librispeech,
  title={Librispeech: an ASR corpus based on public domain audio books},
  author={Panayotov, Vassil and Chen, Guoguo and Povey, Daniel and Khudanpur, Sanjeev},
  booktitle={Acoustics, Speech and Signal Processing (ICASSP), 2015 IEEE International Conference on},
  pages={5206--5210},
  year={2015},
  organization={IEEE}
}