crema_d

  • תיאור :

CREMA-D הוא ערכת נתונים אודיו-ויזואלית לזיהוי רגשות. מערך הנתונים מורכב מהבעות רגשיות פנים וקוליות במשפטים הנאמרים במגוון מצבים רגשיים בסיסיים (שמח, עצוב, כעס, פחד, גועל וניטראלי). נאספו 7,442 קליפים של 91 שחקנים בעלי רקע אתני מגוון. מהדורה זו מכילה רק את זרם האודיו מההקלטה האודיו-ויזואלית המקורית. הדגימות מחולקות בין רכבת, אימות ובדיקה כך שדגימות מכל רמקול שייכות בדיוק לפיצול אחד.

לְפַצֵל דוגמאות
'test' 1,556
'train' 5,144
'validation' 738
  • מבנה תכונה :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'speaker_id': string,
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
שֶׁמַע שֶׁמַע (אף אחד,) int64
תווית ClassLabel int64
מזהה_רמקול מוֹתֵחַ חוּט
  • ציטוט :
@article{cao2014crema,
  title={ {CREMA-D}: Crowd-sourced emotional multimodal actors dataset},
  author={Cao, Houwei and Cooper, David G and Keutmann, Michael K and Gur, Ruben C and Nenkova, Ani and Verma, Ragini},
  journal={IEEE transactions on affective computing},
  volume={5},
  number={4},
  pages={377--390},
  year={2014},
  publisher={IEEE}
}