- תיאור:
שישים הקלטות של אדם אחד שאומר כן או לא בעברית; כל הקלטה אורכה שמונה מילים.
הנקודה העיקרית של מערך הנתונים היא לספק דרך קלה ומהירה לבדוק את התסריטים של Kaldi בחינם.
הארכיון "waves_yesno.tar.gz" מכיל 60 קבצי wav שנדגמו במהירות 8 קילוהרץ. כולם תועדו על ידי אותו דובר זכר, בעברית. בכל קובץ, הפרט אומר 8 מילים; כל מילה היא בעברית עבור "כן" או "לא", כך שכל קובץ הוא רצף אקראי של 8 כן או לא. אין תמלול נפרד מסופק; הרצף מקודד בשם הקובץ, עם 1 עבור כן ו- 0 עבור לא.
דף הבית: https://www.openslr.org/1/
קוד מקור:
tfds.audio.yesno.YesNo
גרסאות:
-
1.0.0
(ברירת המחדל): הערות השחרור לא.
-
גודל ההורדה:
4.49 MiB
מערך נתונים גודל:
16.27 MiB
Auto-במטמון ( תיעוד ): כן
פיצולים:
לְפַצֵל | דוגמאות |
---|---|
'train' | 60 |
- מאפיינים:
FeaturesDict({
'audio': Audio(shape=(None,), dtype=tf.int64),
'audio/filename': Text(shape=(), dtype=tf.string),
'label': Sequence(ClassLabel(shape=(), dtype=tf.int64, num_classes=2)),
})
מפתחות השגחה (ראה
as_supervised
doc ):('audio', 'label')
איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ):
- ציטוט:
@ONLINE {YesNo,
author = "Created for the Kaldi Project",
title = "YesNo",
url = "http://www.openslr.org/1/"
}