כן לא

  • תיאור:

שישים הקלטות של אדם אחד שאומר כן או לא בעברית; כל הקלטה אורכה שמונה מילים.

הנקודה העיקרית של מערך הנתונים היא לספק דרך קלה ומהירה לבדוק את התסריטים של Kaldi בחינם.

הארכיון "waves_yesno.tar.gz" מכיל 60 קבצי wav שנדגמו במהירות 8 קילוהרץ. כולם תועדו על ידי אותו דובר זכר, בעברית. בכל קובץ, הפרט אומר 8 מילים; כל מילה היא בעברית עבור "כן" או "לא", כך שכל קובץ הוא רצף אקראי של 8 כן או לא. אין תמלול נפרד מסופק; הרצף מקודד בשם הקובץ, עם 1 עבור כן ו- 0 עבור לא.

לְפַצֵל דוגמאות
'train' 60
  • מאפיינים:
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'audio/filename': Text(shape=(), dtype=tf.string),
    'label': Sequence(ClassLabel(shape=(), dtype=tf.int64, num_classes=2)),
})
  • ציטוט:
@ONLINE {YesNo,
    author = "Created for the Kaldi Project",
    title  = "YesNo",
    url    = "http://www.openslr.org/1/"
}