- תיאור :
CREMA-D הוא ערכת נתונים אודיו-ויזואלית לזיהוי רגשות. מערך הנתונים מורכב מהבעות רגשיות פנים וקוליות במשפטים הנאמרים במגוון מצבים רגשיים בסיסיים (שמח, עצוב, כעס, פחד, גועל וניטראלי). נאספו 7,442 קליפים של 91 שחקנים בעלי רקע אתני מגוון. מהדורה זו מכילה רק את זרם האודיו מההקלטה האודיו-ויזואלית המקורית. הדגימות מחולקות בין רכבת, אימות ובדיקה כך שדגימות מכל רמקול שייכות בדיוק לפיצול אחד.
תיעוד נוסף : חקור על ניירות עם קוד
קוד מקור :
tfds.audio.CremaD
גרסאות :
-
1.0.0
(ברירת מחדל): אין הערות שחרור.
-
גודל הורדה :
579.25 MiB
גודל מערך נתונים :
1.65 GiB
שמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 1,556 |
'train' | 5,144 |
'validation' | 738 |
- מבנה תכונה :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
'speaker_id': string,
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
שֶׁמַע | שֶׁמַע | (אף אחד,) | int64 | |
תווית | ClassLabel | int64 | ||
מזהה_רמקול | מוֹתֵחַ | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):('audio', 'label')
איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ):
- ציטוט :
@article{cao2014crema,
title={ {CREMA-D}: Crowd-sourced emotional multimodal actors dataset},
author={Cao, Houwei and Cooper, David G and Keutmann, Michael K and Gur, Ruben C and Nenkova, Ani and Verma, Ragini},
journal={IEEE transactions on affective computing},
volume={5},
number={4},
pages={377--390},
year={2014},
publisher={IEEE}
}