- תיאור:
מערך שמע חינם של ספרות מדוברות. חשוב MNIST עבור אודיו.
מערך אודיו/דיבור פשוט המורכב מהקלטות של ספרות מדוברות בקבצי wav במהירות 8kHz. ההקלטות נחתכות כך שיהיו לה שקט כמעט מינימלי בתחילת ובסוף.
5 רמקולים 2,500 הקלטות (50 מכל ספרה לדובר) הגייה באנגלית
הקבצים בשם בתבנית הבאה: {digitLabel} {speakerName} {index} .wav
דף הבית: https://github.com/Jakobovski/free-spoken-digit-dataset
קוד מקור:
tfds.audio.spoken_digit.SpokenDigit
גרסאות:
-
1.0.9
(ברירת המחדל): הערות השחרור לא.
-
גודל ההורדה:
11.42 MiB
מערך נתונים גודל:
45.68 MiB
Auto-במטמון ( תיעוד ): כן
פיצולים:
לְפַצֵל | דוגמאות |
---|---|
'train' | 2,500 |
- מאפיינים:
FeaturesDict({
'audio': Audio(shape=(None,), dtype=tf.int64),
'audio/filename': Text(shape=(), dtype=tf.string),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
})
מפתחות השגחה (ראה
as_supervised
doc ):('audio', 'label')
איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ):
- ציטוט:
@ONLINE {Free Spoken Digit Dataset,
author = "Zohar Jackson",
title = "Spoken_Digit",
year = "2016",
url = "https://github.com/Jakobovski/free-spoken-digit-dataset"
}