세이브

  • 설명 :

SAVEE(Surrey Audio-Visual Expressed Emotion)는 감정 인식 데이터 세트입니다. 4명의 남자 배우들의 7가지 감정, 총 480개의 영국식 영어 발화 녹음으로 구성되어 있습니다. 문장은 표준 TIMIT 말뭉치에서 선택되었으며 각 감정에 대해 발음적으로 균형을 이루었습니다. 이 릴리스에는 원본 시청각 녹음의 오디오 스트림만 포함되어 있습니다.

훈련 세트가 2명의 화자로 구성되고 검증 세트와 테스트 세트가 각각 1명의 화자의 샘플로 구성되도록 데이터가 분할됩니다.

나뉘다
'test' 120
'train' 240
'validation' 120
  • 기능 구조 :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=7),
    'speaker_id': string,
})
  • 기능 문서 :
특징 수업 모양 D타입 설명
풍모Dict
오디오 오디오 (없음,) int64
상표 클래스 레이블 int64
speaker_id 텐서
  • 인용 :
@inproceedings{Vlasenko_combiningframe,
author = {Vlasenko, Bogdan and Schuller, Bjorn and Wendemuth, Andreas and Rigoll, Gerhard},
year = {2007},
month = {01},
pages = {2249-2252},
title = {Combining frame and turn-level information for robust recognition of emotions within speech},
journal = {Proceedings of Interspeech}
}