सार्वजनिक अंतिम वर्ग Skipgram
एक टेक्स्ट फ़ाइल को पार्स करता है और उदाहरणों का एक बैच बनाता है।
नेस्टेड कक्षाएं
कक्षा | स्किपग्राम।विकल्प | के लिए वैकल्पिक विशेषताओं Skipgram |
सार्वजनिक तरीके
स्थिर Skipgram | बनाने ( स्कोप गुंजाइश, स्ट्रिंग फ़ाइल नाम, लांग batchSize, विकल्प ... विकल्प) एक नया स्किपग्राम ऑपरेशन रैपिंग क्लास बनाने के लिए फ़ैक्टरी विधि। |
आउटपुट <पूर्णांक> | currentEpoch () वर्तमान युग संख्या। |
आउटपुट <पूर्णांक> | उदाहरण () शब्द आईडी का एक वेक्टर। |
आउटपुट <पूर्णांक> | लेबल () शब्द आईडी का एक वेक्टर। |
स्थिर Skipgram.Options | minCount (लांग minCount) |
स्थिर Skipgram.Options | subsample (फ्लोट subsample) |
आउटपुट <लांग> | totalWordsProcessed () अब तक संसाधित शब्दों की कुल संख्या। |
आउटपुट <पूर्णांक> | vocabFreq () शब्दों की आवृत्ति। |
आउटपुट <string> | vocabWord () कॉर्पस में शब्दों का एक वेक्टर। |
स्थिर Skipgram.Options | windowSize (लांग windowSize) |
आउटपुट <लांग> | wordsPerEpoch () डेटा फ़ाइल में प्रति युग शब्दों की संख्या। |
विरासत में मिली विधियां
सार्वजनिक तरीके
सार्वजनिक स्थिर Skipgram बनाने ( स्कोप गुंजाइश, स्ट्रिंग फ़ाइल नाम, लांग batchSize, विकल्प ... विकल्प)
एक नया स्किपग्राम ऑपरेशन रैपिंग क्लास बनाने के लिए फ़ैक्टरी विधि।
मापदंडों
दायरा | वर्तमान दायरा |
---|---|
फ़ाइल का नाम | कॉर्पस का टेक्स्ट फ़ाइल नाम। |
बैच का आकार | उत्पादित बैच का आकार। |
विकल्प | वैकल्पिक विशेषता मान रखता है |
रिटर्न
- स्किपग्राम का एक नया उदाहरण
सार्वजनिक स्थिर Skipgram.Options minCount (लांग minCount)
मापदंडों
न्यूनतम गणना | इसे शब्दावली में शामिल करने के लिए शब्दों की न्यूनतम संख्या। |
---|
सार्वजनिक स्थिर Skipgram.Options subsample (फ्लोट subsample)
मापदंडों
उपनमूना | शब्द घटना के लिए दहलीज। उच्च आवृत्ति वाले शब्द बेतरतीब ढंग से डाउन-सैंपल किए जाएंगे। अक्षम करने के लिए 0 पर सेट करें। |
---|
सार्वजनिक स्थिर Skipgram.Options windowSize (लांग windowSize)
मापदंडों
खिड़की का आकार | लक्ष्य के बाएँ और दाएँ भविष्यवाणी करने के लिए शब्दों की संख्या। |
---|