נאום

  • תיאור :

זהו מערך דיבור ברשות הרבים המורכב מ-13,100 קטעי אודיו קצרים של דובר יחיד שקורא קטעים מ-7 ספרי עיון. לכל קליפ מסופק תמלול. אורכם של קליפים נע בין 1 ל-10 שניות ואורך כולל של כ-24 שעות.

הטקסטים פורסמו בין 1884 ל-1964, והם נחלת הכלל. האודיו הוקלט בשנים 2016-17 על ידי פרויקט LibriVox והוא גם ברשות הציבור.

לְפַצֵל דוגמאות
'train' 13,100
  • מבנה תכונה :
FeaturesDict({
    'id': string,
    'speech': Audio(shape=(None,), dtype=int16),
    'text': Text(shape=(), dtype=string),
    'text_normalized': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
תְעוּדַת זֶהוּת מוֹתֵחַ חוּט
נְאוּם שֶׁמַע (אף אחד,) int16
טֶקסט טֶקסט חוּט
text_normalized טֶקסט חוּט
  • ציטוט :
@misc{ljspeech17,
  author       = {Keith Ito},
  title        = {The LJ Speech Dataset},
  howpublished = {\url{https://keithito.com/LJ-Speech-Dataset/} },
  year         = 2017
}