נאום

תיאור :

זהו מערך דיבור ברשות הרבים המורכב מ-13,100 קטעי אודיו קצרים של דובר יחיד שקורא קטעים מ-7 ספרי עיון. לכל קליפ מסופק תמלול. אורכם של קליפים נע בין 1 ל-10 שניות ואורך כולל של כ-24 שעות.

הטקסטים פורסמו בין 1884 ל-1964, והם נחלת הכלל. האודיו הוקלט בשנים 2016-17 על ידי פרויקט LibriVox והוא גם ברשות הציבור.

תיעוד נוסף : חקור על ניירות עם קוד
דף הבית : https://keithito.com/LJ-Speech-Dataset/
קוד מקור : tfds.datasets.ljspeech.Builder
גרסאות :
- 1.1.1 (ברירת מחדל): תקן את סוג נתוני הדיבור באמצעות dtype=tf.int16.
גודל הורדה : 2.56 GiB
גודל מערך נתונים : 10.73 GiB
שמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :

לְפַצֵל	דוגמאות
`'train'`	13,100

מבנה תכונה :

FeaturesDict({
    'id': string,
    'speech': Audio(shape=(None,), dtype=int16),
    'text': Text(shape=(), dtype=string),
    'text_normalized': Text(shape=(), dtype=string),
})

תיעוד תכונה :

תכונה	מעמד	צוּרָה	Dtype
	FeaturesDict
תְעוּדַת זֶהוּת	מוֹתֵחַ		חוּט
נְאוּם	שֶׁמַע	(אף אחד,)	int16
טֶקסט	טֶקסט		חוּט
text_normalized	טֶקסט		חוּט

מפתחות בפיקוח (ראה כמסמך as_supervised ): ('text_normalized', 'speech')
איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ):

ציטוט :

@misc{ljspeech17,
  author       = {Keith Ito},
  title        = {The LJ Speech Dataset},
  howpublished = {\url{https://keithito.com/LJ-Speech-Dataset/} },
  year         = 2017
}

נאום קל לארגן דפים בעזרת אוספים אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.

נאום