
  • 설명 :

SAVEE(Surrey Audio-Visual Expressed Emotion)는 감정 인식 데이터 세트입니다. 4명의 남자 배우들의 7가지 감정, 총 480개의 영국식 영어 발화 녹음으로 구성되어 있습니다. 문장은 표준 TIMIT 말뭉치에서 선택되었으며 각 감정에 대해 발음적으로 균형을 이루었습니다. 이 릴리스에는 원본 시청각 녹음의 오디오 스트림만 포함되어 있습니다.

훈련 세트가 2명의 화자로 구성되고 검증 세트와 테스트 세트가 각각 1명의 화자의 샘플로 구성되도록 데이터가 분할됩니다.

'test' 120
'train' 240
'validation' 120
  • 기능 구조 :
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=7),
    'speaker_id': string,
  • 기능 문서 :
특징 수업 모양 D타입 설명
오디오 오디오 (없음,) int64
상표 클래스 레이블 int64
speaker_id 텐서
  • 인용 :
author = {Vlasenko, Bogdan and Schuller, Bjorn and Wendemuth, Andreas and Rigoll, Gerhard},
year = {2007},
month = {01},
pages = {2249-2252},
title = {Combining frame and turn-level information for robust recognition of emotions within speech},
journal = {Proceedings of Interspeech}