StringNGrams

सार्वजनिक अंतिम वर्ग StringNGrams

रैग्ड स्ट्रिंग डेटा से ngrams बनाता है।

यह ऑप 1 रैग्ड आयाम के साथ एक रैग्ड टेंसर को स्वीकार करता है जिसमें केवल स्ट्रिंग्स होते हैं और एक रैग्ड टेंसर को आउटपुट करता है जिसमें 1 रैग्ड डायमेंशन होता है जिसमें उस स्ट्रिंग के एनग्राम होते हैं, जो अंतरतम अक्ष के साथ जुड़ते हैं।

सार्वजनिक तरीके

स्थिर <टी संख्या फैली> StringNGrams <टी>
बनाने ( स्कोप गुंजाइश, ओपेरैंड <string> डेटा, ओपेरैंड <टी> dataSplits, स्ट्रिंग विभाजक, सूची <लांग> ngramWidths, स्ट्रिंग leftPad, स्ट्रिंग rightPad, लांग padWidth, बूलियन preserveShortSequences)
एक नया StringNGrams ऑपरेशन रैपिंग क्लास बनाने के लिए फ़ैक्टरी विधि।
आउटपुट <string>
ngrams ()
आउटपुट ngrams रैग्ड टेंसर का मान टेंसर।
आउटपुट <टी>
ngramsSplits ()
आउटपुट ngrams के स्प्लिट टेंसर रैग्ड टेंसर।

विरासत में मिली विधियां

सार्वजनिक तरीके

सार्वजनिक स्थिर StringNGrams <टी> बनाने ( स्कोप गुंजाइश, ओपेरैंड <string> डेटा, ओपेरैंड <टी> dataSplits, स्ट्रिंग विभाजक, सूची <लांग> ngramWidths, स्ट्रिंग leftPad, स्ट्रिंग rightPad, लांग padWidth, बूलियन preserveShortSequences)

एक नया StringNGrams ऑपरेशन रैपिंग क्लास बनाने के लिए फ़ैक्टरी विधि।

मापदंडों
दायरा वर्तमान दायरा
आंकड़े रैग्ड स्ट्रिंग टेंसर का मान टेंसर जिससे ngrams बाहर निकलते हैं। एक 1D स्ट्रिंग टेंसर होना चाहिए।
डेटा विभाजन रैग्ड स्ट्रिंग टेंसर के स्प्लिट टेंसर से ngrams बाहर निकलते हैं।
सेपरेटर टोकन के तत्वों के बीच जोड़ने के लिए स्ट्रिंग। बिना विभाजक के "" का प्रयोग करें।
एनग्रामचौड़ाई बनाने के लिए ngrams के आकार।
लेफ्टपैड ngram अनुक्रम के बाईं ओर पैड करने के लिए उपयोग की जाने वाली स्ट्रिंग। केवल तभी उपयोग किया जाता है जब पैड_विड्थ != 0.
राइटपैड ngram अनुक्रम के दाईं ओर पैड करने के लिए उपयोग की जाने वाली स्ट्रिंग। केवल तभी उपयोग किया जाता है जब पैड_विड्थ != 0.
पैडविड्थ प्रत्येक अनुक्रम के प्रत्येक पक्ष में जोड़ने के लिए पैडिंग तत्वों की संख्या। ध्यान दें कि इस मान की परवाह किए बिना पैडिंग कभी भी 'ngram_widths'-1 से अधिक नहीं होगी। अगर `pad_width=-1`, तो `max(ngram_widths)-1` तत्व जोड़ें।
रिटर्न
  • StringNGrams का एक नया उदाहरण

सार्वजनिक आउटपुट <string> ngrams ()

आउटपुट ngrams रैग्ड टेंसर का मान टेंसर।

सार्वजनिक आउटपुट <टी> ngramsSplits ()

आउटपुट ngrams के स्प्लिट टेंसर रैग्ड टेंसर।