لدي سؤال؟ تواصل مع المجتمع في منتدى زيارة منتدى TensorFlow

حفظ

  • الوصف :

SAVEE (Surrey Audio-Visual Expressed Emotion) عبارة عن مجموعة بيانات للتعرف على المشاعر. يتكون من تسجيلات من 4 ممثلين ذكور في 7 مشاعر مختلفة ، إجمالي 480 نطقًا بالإنجليزية البريطانية. تم اختيار الجمل من مجموعة TIMIT المعيارية ومتوازنة صوتيًا لكل عاطفة. يحتوي هذا الإصدار فقط على دفق الصوت من التسجيل الصوتي والمرئي الأصلي. يتم تقسيم البيانات بحيث تتكون مجموعة التدريب من متحدثين ، وتتكون كل من مجموعة التحقق والاختبار من عينات من مكبر صوت واحد ، على التوالي.

  • الصفحة الرئيسية : http://kahlan.eps.surrey.ac.uk/savee/

  • كود المصدر : tfds.audio.Savee

  • إصدارات :

    • 1.0.0 (افتراضي): لا توجد ملاحظات حول الإصدار.
  • حجم التنزيل : Unknown size

  • حجم مجموعة البيانات : 259.15 MiB

  • إرشادات التنزيل اليدوي : تتطلب مجموعة البيانات هذه تنزيل بيانات المصدر يدويًا إلى download_config.manual_dir (الإعدادات الافتراضية على ~/tensorflow_datasets/downloads/manual/ ):
    يجب أن يحتوي manual_dir على الملف AudioData.zip. يجب أن يكون هذا الملف ضمن Data / Zip / AudioData.zip في مجلد مجموعة البيانات المتوفر عند التسجيل. تحتاج إلى التسجيل في http://personal.ee.surrey.ac.uk/Personal/P.Jackson/SAVEE/Register.html للحصول على رابط تنزيل مجموعة البيانات.

  • التخزين المؤقت التلقائي ( التوثيق ): لا

  • الانقسامات :

انشق، مزق أمثلة
'test' 120
'train' 240
'validation' 120
  • الميزات :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
    'speaker_id': tf.string,
})
  • الاقتباس :
@inproceedings{Vlasenko_combiningframe,
author = {Vlasenko, Bogdan and Schuller, Bjorn and Wendemuth, Andreas and Rigoll, Gerhard},
year = {2007},
month = {01},
pages = {2249-2252},
title = {Combining frame and turn-level information for robust recognition of emotions within speech},
journal = {Proceedings of Interspeech}
}