- Deskripsi :
CREMA-D adalah kumpulan data audio-visual untuk pengenalan emosi. Kumpulan data terdiri dari ekspresi emosi wajah dan vokal dalam kalimat yang diucapkan dalam berbagai keadaan emosi dasar (senang, sedih, marah, takut, jijik, dan netral). 7.442 klip dari 91 aktor dengan beragam latar belakang etnis telah dikumpulkan. Rilis ini hanya berisi aliran audio dari rekaman audio-visual asli. Sampel dipisahkan antara pelatihan, validasi, dan pengujian sehingga sampel dari masing-masing pembicara memiliki tepat satu pemisahan.
Kode sumber :
tfds.audio.CremaD
Versi :
-
1.0.0
(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
579.25 MiB
Ukuran set data :
1.65 GiB
Cache otomatis ( dokumentasi ): Tidak
Split :
Membagi | Contoh |
---|---|
'test' | 1.556 |
'train' | 5.144 |
'validation' | 738 |
- Fitur :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=tf.int64),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
'speaker_id': tf.string,
})
Kunci yang diawasi (Lihat
as_supervised
doc ):('audio', 'label')
Kutipan :
@article{cao2014crema,
title={ {CREMA-D}: Crowd-sourced emotional multimodal actors dataset},
author={Cao, Houwei and Cooper, David G and Keutmann, Michael K and Gur, Ruben C and Nenkova, Ani and Verma, Ragini},
journal={IEEE transactions on affective computing},
volume={5},
number={4},
pages={377--390},
year={2014},
publisher={IEEE}
}
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):