שמור

  • תיאור:

SAVEE (Surrey Audio-Visual Expressed Emotion) הוא מערך זיהוי רגשות. הוא מורכב מהקלטות של 4 שחקנים גברים ב -7 רגשות שונים, 480 אמירות אנגליות בריטיות בסך הכל. המשפטים נבחרו מתוך קורפוס ה- TIMIT הסטנדרטי ומאוזנים מבחינה פונטית לכל רגש. מהדורה זו מכילה רק את זרם השמע מההקלטה האודיו-ויזואלית המקורית. הנתונים מפוצלים כך שערכת האימונים מורכבת משני רמקולים, וגם ערכת האימות וגם מבחן מורכבות מדגימות מרמקול אחד, בהתאמה.

  • דף הבית: http://kahlan.eps.surrey.ac.uk/savee/

  • קוד מקור: tfds.audio.Savee

  • גרסאות:

    • 1.0.0 (ברירת המחדל): הערות השחרור לא.
  • גודל ההורדה: Unknown size

  • מערך נתונים גודל: 259.15 MiB

  • הוראות הורדה ידנית: מערך נתונים זה מחייב אותך להוריד את נתוני המקור באופן ידני לתוך download_config.manual_dir (ברירת המחדל היא ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir צריך להכיל את הקובץ AudioData.zip. קובץ זה צריך להיות תחת Data/Zip/AudioData.zip בתיקיית הנתונים שסופקה בעת ההרשמה. אתה צריך להרשם http://personal.ee.surrey.ac.uk/Personal/P.Jackson/SAVEE/Register.html כדי לקבל את הקישור כדי להוריד את הנתונים.

  • Auto-במטמון ( תיעוד ): אין

  • פיצולים:

לְפַצֵל דוגמאות
'test' 120
'train' 240
'validation' 120
  • מאפיינים:
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
    'speaker_id': tf.string,
})
  • ציטוט:
@inproceedings{Vlasenko_combiningframe,
author = {Vlasenko, Bogdan and Schuller, Bjorn and Wendemuth, Andreas and Rigoll, Gerhard},
year = {2007},
month = {01},
pages = {2249-2252},
title = {Combining frame and turn-level information for robust recognition of emotions within speech},
journal = {Proceedings of Interspeech}
}