savee

  • 説明

SAVEE(Surrey Audio-Visual Expressed Emotion)は、感情認識データセットです。これは、7つの異なる感情の4人の男性俳優からの録音、合計480の英国英語の発話で構成されています。文は標準のTIMITコーパスから選択され、感情ごとに音声的にバランスが取れています。このリリースには、元のオーディオビジュアルレコーディングからのオーディオストリームのみが含まれています。データは、トレーニングセットが2人の話者で構成され、検証セットとテストセットの両方がそれぞれ1人の話者からのサンプルで構成されるように分割されます。

  • ホームページhttp://kahlan.eps.surrey.ac.uk/savee/

  • ソースコードtfds.audio.Savee

  • バージョン

    • 1.0.0 (デフォルト):リリースノート。
  • ダウンロードサイズUnknown size

  • データセットのサイズ259.15 MiB

  • マニュアルダウンロード方法:このデータセットは、手動にソースデータをダウンロードする必要がありますdownload_config.manual_dir (デフォルトは~/tensorflow_datasets/downloads/manual/ ):
    manual_dirには、AudioData.zipファイルが含まれている必要があります。このファイルは、登録時に提供されたデータセットフォルダーのData / Zip /AudioData.zipの下にある必要があります。あなたはに登録する必要がありhttp://personal.ee.surrey.ac.uk/Personal/P.Jackson/SAVEE/Register.htmlデータセットをダウンロードするためのリンクを得るために。

  • オートキャッシュされたドキュメント):いいえ

  • スプリット

スプリット
'test' 120
'train' 240
'validation' 120
  • 特長
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
    'speaker_id': tf.string,
})
  • 引用
@inproceedings{Vlasenko_combiningframe,
author = {Vlasenko, Bogdan and Schuller, Bjorn and Wendemuth, Andreas and Rigoll, Gerhard},
year = {2007},
month = {01},
pages = {2249-2252},
title = {Combining frame and turn-level information for robust recognition of emotions within speech},
journal = {Proceedings of Interspeech}
}