selamatkan

  • Deskripsi :

SAVEE (Surrey Audio-Visual Expressed Emotion) adalah kumpulan data pengenalan emosi. Ini terdiri dari rekaman dari 4 aktor laki-laki dalam 7 emosi yang berbeda, total 480 ucapan bahasa Inggris British. Kalimat dipilih dari corpus TIMIT standar dan seimbang secara fonetik untuk setiap emosi. Rilis ini hanya berisi streaming audio dari rekaman audio-visual asli.

Data dibagi sehingga set pelatihan terdiri dari 2 pembicara, dan set validasi dan tes masing-masing terdiri dari sampel dari 1 pembicara.

Membelah Contoh
'test' 120
'train' 240
'validation' 120
  • Struktur fitur :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=7),
    'speaker_id': string,
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
audio Audio (Tidak ada,) int64
label LabelKelas int64
speaker_id Tensor rangkaian
  • Kutipan :
@inproceedings{Vlasenko_combiningframe,
author = {Vlasenko, Bogdan and Schuller, Bjorn and Wendemuth, Andreas and Rigoll, Gerhard},
year = {2007},
month = {01},
pages = {2249-2252},
title = {Combining frame and turn-level information for robust recognition of emotions within speech},
journal = {Proceedings of Interspeech}
}