- תיאור:
זהו מערך דיבור ברשות הציבור המורכב מ -13,100 קטעי שמע קצרים של רמקול בודד הקורא קטעים מתוך 7 ספרים לא בדיוניים. תמליל מסופק לכל קליפ. אורך הקליפים משתנה בין 1 ל -10 שניות ובאורך כולל של כ -24 שעות.
הטקסטים פורסמו בין השנים 1884 - 1964 והם נחלת הכלל. השמע הוקלט בשנים 2016-17 על ידי פרויקט LibriVox והוא גם נחלת הכלל.
קוד מקור:
tfds.audio.Ljspeech
גרסאות:
-
1.1.0
(ברירת המחדל): הערות השחרור לא.
-
גודל ההורדה:
2.56 GiB
גודל בסיס הנתונים:
10.73 GiB
Auto-במטמון ( תיעוד ): אין
פיצולים:
לְפַצֵל | דוגמאות |
---|---|
'train' | 13,100 |
- מאפיינים:
FeaturesDict({
'id': tf.string,
'speech': Audio(shape=(None,), dtype=tf.int64),
'text': Text(shape=(), dtype=tf.string),
'text_normalized': Text(shape=(), dtype=tf.string),
})
מפתחות השגחה (ראה
as_supervised
doc ):('text_normalized', 'speech')
איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ):
- ציטוט:
@misc{ljspeech17,
author = {Keith Ito},
title = {The LJ Speech Dataset},
howpublished = {\url{https://keithito.com/LJ-Speech-Dataset/} },
year = 2017
}