Эта страница была переведа с помощью Cloud Translation API.
Switch to English

crema_d

  • Описание :

CREMA-D - это набор аудиовизуальных данных для распознавания эмоций. Набор данных состоит из лицевых и голосовых эмоциональных выражений в предложениях, произносимых в различных основных эмоциональных состояниях (счастье, грусть, гнев, страх, отвращение и нейтральный). Было собрано 7 442 ролика с участием 91 актера разного этнического происхождения. Этот выпуск содержит только аудиопоток из исходной аудиовизуальной записи. Образцы делятся между обучением, проверкой и тестированием, так что образцы от каждого выступающего принадлежат ровно одной группе.

Трещина Примеры
'test' 1,556
'train' 5 144
'validation' 738
  • Особенности :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    'speaker_id': tf.string,
})
  • Контролируемые ключи (см. as_supervised doc ): ('audio', 'label')

  • Цитата :

@article{cao2014crema,
  title={ {CREMA-D}: Crowd-sourced emotional multimodal actors dataset},
  author={Cao, Houwei and Cooper, David G and Keutmann, Michael K and Gur, Ruben C and Nenkova, Ani and Verma, Ragini},
  journal={IEEE transactions on affective computing},
  volume={5},
  number={4},
  pages={377--390},
  year={2014},
  publisher={IEEE}
}