- תיאור :
LibriSpeech הוא קורפוס של כ-1000 שעות של דיבור באנגלית קריאה עם קצב דגימה של 16 קילו-הרץ, שהוכן על ידי ואסיל פאנאיוטוב בסיועו של דניאל פובי. הנתונים נגזרים מספרי אודיו שנקראו מפרויקט LibriVox, ופולחו ויושרו בקפידה.
דף הבית : http://www.openslr.org/12
קוד מקור :
tfds.audio.Librispeech
גרסאות :
-
2.1.0
(ברירת מחדל): אין הערות שחרור.
-
גודל הורדה :
57.14 GiB
גודל מערך נתונים :
304.47 GiB
שמור אוטומטי במטמון ( תיעוד ): לא
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'dev_clean' | 2,703 |
'dev_other' | 2,864 |
'test_clean' | 2,620 |
'test_other' | 2,939 |
'train_clean100' | 28,539 |
'train_clean360' | 104,014 |
'train_other500' | 148,688 |
- מבנה תכונה :
FeaturesDict({
'chapter_id': tf.int64,
'id': tf.string,
'speaker_id': tf.int64,
'speech': Audio(shape=(None,), dtype=tf.int64),
'text': Text(shape=(), dtype=tf.string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
פרק_מזהה | מוֹתֵחַ | tf.int64 | ||
תְעוּדַת זֶהוּת | מוֹתֵחַ | tf.string | ||
מזהה_רמקול | מוֹתֵחַ | tf.int64 | ||
נְאוּם | שֶׁמַע | (אף אחד,) | tf.int64 | |
טֶקסט | טֶקסט | tf.string |
מפתחות בפיקוח (ראה
as_supervised
doc ):('speech', 'text')
איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ):
- ציטוט :
@inproceedings{panayotov2015librispeech,
title={Librispeech: an ASR corpus based on public domain audio books},
author={Panayotov, Vassil and Chen, Guoguo and Povey, Daniel and Khudanpur, Sanjeev},
booktitle={Acoustics, Speech and Signal Processing (ICASSP), 2015 IEEE International Conference on},
pages={5206--5210},
year={2015},
organization={IEEE}
}