ליבריטים

תיאור :

LibriTTS הוא קורפוס אנגלית מרובה דוברי של כ-585 שעות של דיבור באנגלית קריאה בקצב דגימה של 24kHz, שהוכן על ידי Heiga Zen בסיוע חברי צוות Google Speech ו-Google Brain. קורפוס LibriTTS מיועד לחקר TTS. הוא נגזר מהחומרים המקוריים (קובצי אודיו mp3 מ-LibriVox וקבצי טקסט מ-Project Gutenberg) של קורפוס LibriSpeech. ההבדלים העיקריים מקורפוס LibriSpeech מפורטים להלן:

קבצי השמע הם בקצב דגימה של 24kHz.
הנאום מפוצל בהפסקות המשפט.
גם טקסטים מקוריים וגם מנורמלים כלולים.
ניתן לחלץ מידע קונטקסטואלי (למשל, משפטים סמוכים).
התבטאויות עם רעשי רקע משמעותיים אינם נכללים.

תיעוד נוסף : חקור על ניירות עם קוד
דף הבית : http://www.openslr.org/60
קוד מקור : tfds.datasets.libritts.Builder
גרסאות :
- 1.0.1 (ברירת מחדל): אין הערות שחרור.
גודל הורדה : 78.42 GiB
גודל מערך נתונים : 271.41 GiB
שמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :

לְפַצֵל	דוגמאות
`'dev_clean'`	5,736
`'dev_other'`	4,613
`'test_clean'`	4,837
`'test_other'`	5,120
`'train_clean100'`	33,236
`'train_clean360'`	116,500
`'train_other500'`	205,044

מבנה תכונה :

FeaturesDict({
    'chapter_id': int64,
    'id': string,
    'speaker_id': int64,
    'speech': Audio(shape=(None,), dtype=int64),
    'text_normalized': Text(shape=(), dtype=string),
    'text_original': Text(shape=(), dtype=string),
})

תיעוד תכונה :

תכונה	מעמד	צוּרָה	Dtype
	FeaturesDict
פרק_מזהה	מוֹתֵחַ		int64
תְעוּדַת זֶהוּת	מוֹתֵחַ		חוּט
מזהה_רמקול	מוֹתֵחַ		int64
נְאוּם	שֶׁמַע	(אף אחד,)	int64
text_normalized	טֶקסט		חוּט
text_original	טֶקסט		חוּט

מפתחות בפיקוח (ראה כמסמך as_supervised ): ('text_normalized', 'speech')
איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ):

ציטוט :

@inproceedings{zen2019libritts,
  title = {LibriTTS: A Corpus Derived from LibriSpeech for Text-to-Speech},
  author = {H. Zen and V. Dang and R. Clark and Y. Zhang and R. J. Weiss and Y. Jia and Z. Chen and Y. Wu},
  booktitle = {Proc. Interspeech},
  month = sep,
  year = {2019},
  doi = {10.21437/Interspeech.2019-2441},
}

ליבריטים קל לארגן דפים בעזרת אוספים אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.

ליבריטים