CTCLossV2

सार्वजनिक अंतिम वर्ग CTCLossV2

प्रत्येक बैच प्रविष्टि के लिए CTC हानि (लॉग संभाव्यता) की गणना करता है। गणना भी करता है

ढाल। यह वर्ग आपके लिए सॉफ्टमैक्स ऑपरेशन करता है, इसलिए इनपुट होना चाहिए जैसे LSTM द्वारा आउटपुट का रैखिक अनुमान।

नेस्टेड कक्षाएं

कक्षा CTCLossV2.Options के लिए वैकल्पिक विशेषताओं CTCLossV2

सार्वजनिक तरीके

स्थिर CTCLossV2
बनाने ( स्कोप गुंजाइश, ओपेरैंड <फ्लोट> आदानों, ओपेरैंड <लांग> labelsIndices, ओपेरैंड <पूर्णांक> labelsValues, ओपेरैंड <पूर्णांक> sequenceLength, विकल्प ... विकल्प)
एक नया CTCLossV2 ऑपरेशन रैपिंग क्लास बनाने के लिए फ़ैक्टरी विधि।
स्थिर CTCLossV2.Options
ctcMergeRepeated (बूलियन ctcMergeRepeated)
आउटपुट <फ्लोट>
ढाल ()
`नुकसान` का ढाल।
स्थिर CTCLossV2.Options
ignoreLongerOutputsThanInputs (बूलियन ignoreLongerOutputsThanInputs)
आउटपुट <फ्लोट>
नुकसान ()
लॉग-संभावनाओं वाला एक वेक्टर (बैच)।
स्थिर CTCLossV2.Options
preprocessCollapseRepeated (बूलियन preprocessCollapseRepeated)

विरासत में मिली विधियां

सार्वजनिक तरीके

सार्वजनिक स्थिर CTCLossV2 बनाने ( स्कोप गुंजाइश, ओपेरैंड <फ्लोट> आदानों, ओपेरैंड <लांग> labelsIndices, ओपेरैंड <पूर्णांक> labelsValues, ओपेरैंड <पूर्णांक> sequenceLength, विकल्प ... विकल्प)

एक नया CTCLossV2 ऑपरेशन रैपिंग क्लास बनाने के लिए फ़ैक्टरी विधि।

मापदंडों
दायरा वर्तमान दायरा
आदानों 3-डी, आकार: `(max_time x बैच_साइज़ x num_classes)`, logits. डिफ़ॉल्ट रिक्त लेबल 0 है बल्कि num_classes - 1 है।
लेबलसूचकांक एक `स्पार्स टेंसर . के सूचकांक `. `लेबल_इंडिस (i, :) == [बी, टी]` का अर्थ है `लेबल_वैल्यू (i)` आईडी को `(बैच बी, टाइम टी)` के लिए स्टोर करता है।
लेबलमान दिए गए बैच और समय से जुड़े मान (लेबल)।
अनुक्रम लंबाई अनुक्रम लंबाई (बैच) वाला एक वेक्टर।
विकल्प वैकल्पिक विशेषता मान रखता है
रिटर्न
  • CTCLossV2 का एक नया उदाहरण

सार्वजनिक स्थिर CTCLossV2.Options ctcMergeRepeated (बूलियन ctcMergeRepeated)

मापदंडों
ctcMergeदोहराया अदिश। अगर सेट गलत पर, सीटीसी गणना के दौरान बार-बार गैर खाली लेबल से मर्ज नहीं जाएंगे और अलग-अलग लेबल के रूप में व्याख्या कर रहे हैं। यह सीटीसी का सरलीकृत संस्करण है।

सार्वजनिक आउटपुट <फ्लोट> ढाल ()

`नुकसान` का ढाल। 3-डी, आकार: `(max_time x बैच_साइज़ x num_classes)`।

सार्वजनिक स्थिर CTCLossV2.Options ignoreLongerOutputsThanInputs (बूलियन ignoreLongerOutputsThanInputs)

मापदंडों
अनदेखा करेंLongerOutputsTanInputs अदिश। यदि सही पर सेट किया जाता है, तो सीटीसी गणना के दौरान, इनपुट अनुक्रमों की तुलना में लंबे आउटपुट अनुक्रम वाले आइटम छोड़ दिए जाते हैं: वे हानि अवधि में योगदान नहीं करते हैं और शून्य-ग्रेडिएंट होते हैं।

सार्वजनिक आउटपुट <फ्लोट> नुकसान ()

लॉग-संभावनाओं वाला एक वेक्टर (बैच)।

सार्वजनिक स्थिर CTCLossV2.Options preprocessCollapseRepeated (बूलियन preprocessCollapseRepeated)

मापदंडों
पूर्वप्रक्रियासंक्षिप्ततादोहराया स्केलर, यदि सही है तो सीटीसी गणना से पहले बार-बार लेबल को ध्वस्त कर दिया जाता है।