Mfcc

सार्वजनिक अंतिम वर्ग एमएफसीसी

स्पेक्ट्रोग्राम को ऐसे रूप में परिवर्तित करता है जो वाक् पहचान के लिए उपयोगी हो।

मेल फ़्रीक्वेंसी सेप्स्ट्रल गुणांक ऑडियो डेटा का प्रतिनिधित्व करने का एक तरीका है जो मशीन लर्निंग के लिए एक इनपुट सुविधा के रूप में प्रभावी है। वे एक स्पेक्ट्रोग्राम (एक 'सेपस्ट्रम') के स्पेक्ट्रम को लेकर और कुछ उच्च आवृत्तियों को त्यागकर बनाए जाते हैं जो मानव कान के लिए कम महत्वपूर्ण हैं। वाक् पहचान की दुनिया में उनका एक लंबा इतिहास है, और अधिक जानने के लिए https://en.wikipedia.org/wiki/Mel-frequeency_cepstrum एक अच्छा संसाधन है।

नेस्टेड क्लासेस

कक्षा एमएफसीसी.विकल्प Mfcc के लिए वैकल्पिक विशेषताएँ

स्थिरांक

डोरी OP_NAME इस ऑप का नाम, जैसा कि TensorFlow कोर इंजन द्वारा जाना जाता है

सार्वजनिक तरीके

आउटपुट < TFloat32 >
आउटपुट के रूप में ()
टेंसर का प्रतीकात्मक हैंडल लौटाता है।
स्थिर एमएफसीसी
बनाएं ( स्कोप स्कोप, ऑपरेंड < TFloat32 > स्पेक्ट्रोग्राम, ऑपरेंड < TInt32 > नमूना दर, विकल्प... विकल्प)
एक नए एमएफसीसी ऑपरेशन को लपेटकर एक क्लास बनाने की फ़ैक्टरी विधि।
स्थिर एमएफसीसी.विकल्प
dctCoefficientCount (लंबा dctCoefficientCount)
स्थिर एमएफसीसी.विकल्प
फ़िल्टरबैंकचैनलकाउंट (लंबा फ़िल्टरबैंकचैनलकाउंट)
स्थिर एमएफसीसी.विकल्प
लोअरफ़्रीक्वेंसीलिमिट (फ़्लोट लोअरफ़्रीक्वेंसीलिमिट)
आउटपुट < TFloat32 >
स्थिर एमएफसीसी.विकल्प
अपरफ़्रीक्वेंसीलिमिट (फ्लोट अपरफ़्रीक्वेंसीलिमिट)

विरासत में मिली विधियाँ

स्थिरांक

सार्वजनिक स्थैतिक अंतिम स्ट्रिंग OP_NAME

इस ऑप का नाम, जैसा कि TensorFlow कोर इंजन द्वारा जाना जाता है

स्थिर मान: "Mfcc"

सार्वजनिक तरीके

सार्वजनिक आउटपुट < TFloat32 > asOutput ()

टेंसर का प्रतीकात्मक हैंडल लौटाता है।

TensorFlow संचालन के इनपुट किसी अन्य TensorFlow ऑपरेशन के आउटपुट हैं। इस पद्धति का उपयोग एक प्रतीकात्मक हैंडल प्राप्त करने के लिए किया जाता है जो इनपुट की गणना का प्रतिनिधित्व करता है।

सार्वजनिक स्थैतिक एमएफसीसी निर्माण ( स्कोप स्कोप, ऑपरेंड < TFloat32 > स्पेक्ट्रोग्राम, ऑपरेंड < TInt32 > नमूना दर, विकल्प... विकल्प)

एक नए एमएफसीसी ऑपरेशन को लपेटकर एक क्लास बनाने की फ़ैक्टरी विधि।

पैरामीटर
दायरा वर्तमान दायरा
spectrogram आमतौर पर स्पेक्ट्रोग्राम ऑप द्वारा निर्मित, परिमाण_वर्ग को सत्य पर सेट किया जाता है।
नमूना दर स्रोत ऑडियो ने प्रति सेकंड कितने नमूनों का उपयोग किया।
विकल्प वैकल्पिक गुण मान रखता है
रिटर्न
  • एमएफसीसी का एक नया उदाहरण

सार्वजनिक स्थैतिक Mfcc.Options dctCoefficientCount (लंबा dctCoefficientCount)

पैरामीटर
dctCoefficientCount प्रति टाइम स्लाइस में कितने आउटपुट चैनल तैयार करने हैं।

सार्वजनिक स्थैतिक Mfcc.Options फ़िल्टरबैंकचैनलकाउंट (लंबा फ़िल्टरबैंकचैनलकाउंट)

पैरामीटर
फ़िल्टरबैंकचैनलकाउंट मेल बैंक का रिज़ॉल्यूशन आंतरिक रूप से उपयोग किया जाता है।

सार्वजनिक स्थैतिक Mfcc.ऑप्शंस लोअरफ़्रीक्वेंसीलिमिट (फ़्लोट लोअरफ़्रीक्वेंसीलिमिट)

पैरामीटर
निचलीआवृत्तिसीमा सेप्टस्ट्रम की गणना करते समय उपयोग की जाने वाली सबसे कम आवृत्ति।

सार्वजनिक आउटपुट < TFloat32 > आउटपुट ()

सार्वजनिक स्थैतिक Mfcc.ऑप्शंस अपरफ़्रीक्वेंसीलिमिट (फ़्लोट अपरफ़्रीक्वेंसीलिमिट)

पैरामीटर
ऊपरीआवृत्तिसीमा सेप्टस्ट्रम की गणना करते समय उपयोग की जाने वाली उच्चतम आवृत्ति।