- Açıklama:
LibriSpeech ASR corpus ile birlikte kullanılacak dil modelleme kaynakları.
Anasayfa: http://www.openslr.org/11
Kaynak kodu:
tfds.text.LibrispeechLm
sürümleri:
-
0.1.0
(varsayılan): Hayır sürüm notları.
-
İndirme boyutu:
1.40 GiB
Veri kümesi boyutu:
4.62 GiB
Otomatik önbelleğe ( dokümantasyon ): Hayır
Splits:
Bölmek | Örnekler |
---|---|
'train' | 40.418.260 |
- Özellikler:
FeaturesDict({
'text': Text(shape=(), dtype=tf.string),
})
Denetimli tuşları (Bkz
as_supervised
doc ):('text', 'text')
Şekil ( tfds.show_examples ): desteklenmez.
Örnekler ( tfds.as_dataframe ):
- Citation:
@inproceedings{panayotov2015librispeech,
title={Librispeech: an ASR corpus based on public domain audio books},
author={Panayotov, Vassil and Chen, Guoguo and Povey, Daniel and Khudanpur, Sanjeev},
booktitle={Acoustics, Speech and Signal Processing (ICASSP), 2015 IEEE International Conference on},
pages={5206--5210},
year={2015},
organization={IEEE}
}