נאום ליבריז

  • תיאור :

LibriSpeech הוא קורפוס של כ-1000 שעות של דיבור באנגלית קריאה עם קצב דגימה של 16 קילו-הרץ, שהוכן על ידי ואסיל פאנאיוטוב בסיועו של דניאל פובי. הנתונים נגזרים מספרי אודיו שנקראו מפרויקט LibriVox, ופולחו ויושרו בקפידה.

  • דף הבית : http://www.openslr.org/12

  • קוד מקור : tfds.audio.Librispeech

  • גרסאות :

    • 2.1.0 (ברירת מחדל): אין הערות שחרור.
  • גודל הורדה : 57.14 GiB

  • גודל מערך נתונים : 304.47 GiB

  • שמור אוטומטי במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'dev_clean' 2,703
'dev_other' 2,864
'test_clean' 2,620
'test_other' 2,939
'train_clean100' 28,539
'train_clean360' 104,014
'train_other500' 148,688
  • מבנה תכונה :
FeaturesDict({
    'chapter_id': tf.int64,
    'id': tf.string,
    'speaker_id': tf.int64,
    'speech': Audio(shape=(None,), dtype=tf.int64),
    'text': Text(shape=(), dtype=tf.string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
פרק_מזהה מוֹתֵחַ tf.int64
תְעוּדַת זֶהוּת מוֹתֵחַ tf.string
מזהה_רמקול מוֹתֵחַ tf.int64
נְאוּם שֶׁמַע (אף אחד,) tf.int64
טֶקסט טֶקסט tf.string
  • ציטוט :
@inproceedings{panayotov2015librispeech,
  title={Librispeech: an ASR corpus based on public domain audio books},
  author={Panayotov, Vassil and Chen, Guoguo and Povey, Daniel and Khudanpur, Sanjeev},
  booktitle={Acoustics, Speech and Signal Processing (ICASSP), 2015 IEEE International Conference on},
  pages={5206--5210},
  year={2015},
  organization={IEEE}
}