- תיאור :
זהו מערך דיבור ברשות הרבים המורכב מ-13,100 קטעי אודיו קצרים של דובר יחיד שקורא קטעים מ-7 ספרי עיון. לכל קליפ מסופק תמלול. אורכם של קליפים נע בין 1 ל-10 שניות ואורך כולל של כ-24 שעות.
הטקסטים פורסמו בין 1884 ל-1964, והם נחלת הכלל. האודיו הוקלט בשנים 2016-17 על ידי פרויקט LibriVox והוא גם ברשות הציבור.
תיעוד נוסף : חקור על ניירות עם קוד
דף הבית : https://keithito.com/LJ-Speech-Dataset/
קוד מקור :
tfds.datasets.ljspeech.Builder
גרסאות :
-
1.1.1
(ברירת מחדל): תקן את סוג נתוני הדיבור באמצעות dtype=tf.int16.
-
גודל הורדה :
2.56 GiB
גודל מערך נתונים :
10.73 GiB
שמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 13,100 |
- מבנה תכונה :
FeaturesDict({
'id': string,
'speech': Audio(shape=(None,), dtype=int16),
'text': Text(shape=(), dtype=string),
'text_normalized': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
תְעוּדַת זֶהוּת | מוֹתֵחַ | חוּט | ||
נְאוּם | שֶׁמַע | (אף אחד,) | int16 | |
טֶקסט | טֶקסט | חוּט | ||
text_normalized | טֶקסט | חוּט |
מפתחות בפיקוח (ראה כמסמך
as_supervised
):('text_normalized', 'speech')
איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ):
- ציטוט :
@misc{ljspeech17,
author = {Keith Ito},
title = {The LJ Speech Dataset},
howpublished = {\url{https://keithito.com/LJ-Speech-Dataset/} },
year = 2017
}