krema_d

  • Açıklama:

CREMA-D, duygu tanıma için bir görsel-işitsel veri setidir. Veri seti, bir dizi temel duygusal durumda (mutlu, üzgün, öfke, korku, iğrenme ve tarafsız) konuşulan cümlelerde yüz ve sesli duygusal ifadelerden oluşur. Farklı etnik kökenlere sahip 91 oyuncunun 7.442 klibi toplandı. Bu sürüm, yalnızca orijinal görsel-işitsel kayıttan gelen ses akışını içerir. Numuneler, her bir konuşmacıdan alınan numunelerin tam olarak bir bölmeye ait olması için eğitim, doğrulama ve test arasında bölünür.

Bölmek Örnekler
'test' 1.556
'train' 5144
'validation' 738
  • Özellikler:
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    'speaker_id': tf.string,
})
  • Citation:
@article{cao2014crema,
  title={ {CREMA-D}: Crowd-sourced emotional multimodal actors dataset},
  author={Cao, Houwei and Cooper, David G and Keutmann, Michael K and Gur, Ruben C and Nenkova, Ani and Verma, Ragini},
  journal={IEEE transactions on affective computing},
  volume={5},
  number={4},
  pages={377--390},
  year={2014},
  publisher={IEEE}
}