Skipgram

सार्वजनिक अंतिम वर्ग Skipgram

एक टेक्स्ट फ़ाइल को पार्स करता है और उदाहरणों का एक बैच बनाता है।

नेस्टेड कक्षाएं

कक्षा स्किपग्राम।विकल्प के लिए वैकल्पिक विशेषताओं Skipgram

सार्वजनिक तरीके

स्थिर Skipgram
बनाने ( स्कोप गुंजाइश, स्ट्रिंग फ़ाइल नाम, लांग batchSize, विकल्प ... विकल्प)
एक नया स्किपग्राम ऑपरेशन रैपिंग क्लास बनाने के लिए फ़ैक्टरी विधि।
आउटपुट <पूर्णांक>
currentEpoch ()
वर्तमान युग संख्या।
आउटपुट <पूर्णांक>
उदाहरण ()
शब्द आईडी का एक वेक्टर।
आउटपुट <पूर्णांक>
लेबल ()
शब्द आईडी का एक वेक्टर।
स्थिर Skipgram.Options
minCount (लांग minCount)
स्थिर Skipgram.Options
subsample (फ्लोट subsample)
आउटपुट <लांग>
totalWordsProcessed ()
अब तक संसाधित शब्दों की कुल संख्या।
आउटपुट <पूर्णांक>
vocabFreq ()
शब्दों की आवृत्ति।
आउटपुट <string>
vocabWord ()
कॉर्पस में शब्दों का एक वेक्टर।
स्थिर Skipgram.Options
windowSize (लांग windowSize)
आउटपुट <लांग>
wordsPerEpoch ()
डेटा फ़ाइल में प्रति युग शब्दों की संख्या।

विरासत में मिली विधियां

सार्वजनिक तरीके

सार्वजनिक स्थिर Skipgram बनाने ( स्कोप गुंजाइश, स्ट्रिंग फ़ाइल नाम, लांग batchSize, विकल्प ... विकल्प)

एक नया स्किपग्राम ऑपरेशन रैपिंग क्लास बनाने के लिए फ़ैक्टरी विधि।

मापदंडों
दायरा वर्तमान दायरा
फ़ाइल का नाम कॉर्पस का टेक्स्ट फ़ाइल नाम।
बैच का आकार उत्पादित बैच का आकार।
विकल्प वैकल्पिक विशेषता मान रखता है
रिटर्न
  • स्किपग्राम का एक नया उदाहरण

सार्वजनिक आउटपुट <पूर्णांक> currentEpoch ()

वर्तमान युग संख्या।

सार्वजनिक आउटपुट <पूर्णांक> उदाहरण ()

शब्द आईडी का एक वेक्टर।

सार्वजनिक आउटपुट <पूर्णांक> लेबल ()

शब्द आईडी का एक वेक्टर।

सार्वजनिक स्थिर Skipgram.Options minCount (लांग minCount)

मापदंडों
न्यूनतम गणना इसे शब्दावली में शामिल करने के लिए शब्दों की न्यूनतम संख्या।

सार्वजनिक स्थिर Skipgram.Options subsample (फ्लोट subsample)

मापदंडों
उपनमूना शब्द घटना के लिए दहलीज। उच्च आवृत्ति वाले शब्द बेतरतीब ढंग से डाउन-सैंपल किए जाएंगे। अक्षम करने के लिए 0 पर सेट करें।

सार्वजनिक आउटपुट <लांग> totalWordsProcessed ()

अब तक संसाधित शब्दों की कुल संख्या।

सार्वजनिक आउटपुट <पूर्णांक> vocabFreq ()

शब्दों की आवृत्ति। गैर-आरोही क्रम में क्रमबद्ध।

सार्वजनिक आउटपुट <string> vocabWord ()

कॉर्पस में शब्दों का एक वेक्टर।

सार्वजनिक स्थिर Skipgram.Options windowSize (लांग windowSize)

मापदंडों
खिड़की का आकार लक्ष्य के बाएँ और दाएँ भविष्यवाणी करने के लिए शब्दों की संख्या।

सार्वजनिक आउटपुट <लांग> wordsPerEpoch ()

डेटा फ़ाइल में प्रति युग शब्दों की संख्या।