tiết kiệm

  • Mô tả :

SAVEE (Surrey Audio-Visual Expressed Emotion) là một bộ dữ liệu nhận dạng cảm xúc. Nó bao gồm các bản ghi âm của 4 diễn viên nam với 7 cảm xúc khác nhau, tổng cộng là 480 cách nói tiếng Anh của người Anh. Các câu được chọn từ kho văn bản TIMIT tiêu chuẩn và được cân bằng về mặt ngữ âm cho từng cảm xúc. Bản phát hành này chỉ chứa luồng âm thanh từ bản ghi nghe nhìn gốc.

Dữ liệu được phân chia sao cho tập huấn luyện bao gồm 2 người nói và cả tập xác nhận và kiểm tra đều bao gồm các mẫu tương ứng từ 1 người nói.

Tách ra ví dụ
'test' 120
'train' 240
'validation' 120
  • Cấu trúc tính năng :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=7),
    'speaker_id': string,
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự miêu tả
Tính năngDict
âm thanh âm thanh (Không có,) int64
nhãn mác LớpNhãn int64
speaker_id tenxơ chuỗi
  • trích dẫn :
@inproceedings{Vlasenko_combiningframe,
author = {Vlasenko, Bogdan and Schuller, Bjorn and Wendemuth, Andreas and Rigoll, Gerhard},
year = {2007},
month = {01},
pages = {2249-2252},
title = {Combining frame and turn-level information for robust recognition of emotions within speech},
journal = {Proceedings of Interspeech}
}