एमएल समुदाय दिवस 9 नवंबर है! TensorFlow, JAX से नई जानकारी के लिए हमसे जुड़ें, और अधिक जानें

सेवी

  • विवरण:

SAVEE (सरे ऑडियो-विजुअल एक्सप्रेस्ड इमोशन) एक इमोशन रिकग्निशन डेटासेट है। इसमें ७ अलग-अलग भावनाओं में ४ पुरुष अभिनेताओं की रिकॉर्डिंग शामिल है, कुल ४८० ब्रिटिश अंग्रेजी उच्चारण। वाक्यों को मानक TIMIT कॉर्पस से चुना गया था और प्रत्येक भावना के लिए ध्वन्यात्मक रूप से संतुलित किया गया था। इस रिलीज़ में मूल ऑडियो-विज़ुअल रिकॉर्डिंग से केवल ऑडियो स्ट्रीम है। डेटा को विभाजित किया जाता है ताकि प्रशिक्षण सेट में 2 स्पीकर हों, और सत्यापन और परीक्षण सेट दोनों में क्रमशः 1 स्पीकर के नमूने हों।

  • होमपेज: http://kahlan.eps.surrey.ac.uk/savee/

  • स्रोत कोड: tfds.audio.Savee

  • संस्करण:

    • 1.0.0 (डिफ़ॉल्ट): नहीं रिलीज नोट्स।
  • डाउनलोड का आकार: Unknown size

  • डेटासेट का आकार: 259.15 MiB

  • मैनुअल डाउनलोड के निर्देश: यह डेटासेट आप में मैन्युअल रूप से स्रोत डेटा डाउनलोड करने के लिए की आवश्यकता है download_config.manual_dir (करने के लिए डिफ़ॉल्ट ~/tensorflow_datasets/downloads/manual/ ):
    मैन्युअल_दिर में ऑडियोडेटा.ज़िप फ़ाइल होनी चाहिए। यह फ़ाइल पंजीकरण के समय प्रदान किए गए डेटासेट फ़ोल्डर में डेटा/ज़िप/ऑडियोडेटा.ज़िप के अंतर्गत होनी चाहिए। आपको कम से रजिस्टर करने की आवश्यकता http://personal.ee.surrey.ac.uk/Personal/P.Jackson/SAVEE/Register.html आदेश डाटासेट डाउनलोड करने के लिए लिंक प्राप्त करने के लिए।

  • ऑटो-कैश ( प्रलेखन ): नहीं

  • विभाजन:

विभाजित करना उदाहरण
'test' १२०
'train' 240
'validation' १२०
  • विशेषताएं:
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
    'speaker_id': tf.string,
})
  • प्रशस्ति पत्र:
@inproceedings{Vlasenko_combiningframe,
author = {Vlasenko, Bogdan and Schuller, Bjorn and Wendemuth, Andreas and Rigoll, Gerhard},
year = {2007},
month = {01},
pages = {2249-2252},
title = {Combining frame and turn-level information for robust recognition of emotions within speech},
journal = {Proceedings of Interspeech}
}