כן לא

  • תיאור :

שישים הקלטות של אדם אחד שאומר כן או לא בעברית; כל הקלטה באורך שמונה מילים.

הנקודה העיקרית של מערך הנתונים היא לספק דרך קלה ומהירה לבדוק את הסקריפטים של Kaldi בחינם.

הארכיון "waves_yesno.tar.gz" מכיל 60 קבצי WAV, שנדגמו במהירות של 8 קילו-הרץ. כולם הוקלטו על ידי אותו דובר זכר, בעברית. בכל קובץ, הפרט אומר 8 מילים; כל מילה היא בעברית של "כן" או "לא", כך שכל קובץ הוא רצף אקראי של 8 כן-ים או לא. לא מסופק תמלול נפרד; הרצף מקודד בשם הקובץ, עם 1 עבור כן ו-0 עבור לא.

לְפַצֵל דוגמאות
'train' 60
  • מבנה תכונה :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=2)),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
שֶׁמַע שֶׁמַע (אף אחד,) int64
אודיו/שם קובץ טֶקסט חוּט
תווית Sequence (ClassLabel) (אף אחד,) int64
  • ציטוט :
@ONLINE {YesNo,
    author = "Created for the Kaldi Project",
    title  = "YesNo",
    url    = "http://www.openslr.org/1/"
}