StringNGrams

सार्वजनिक अंतिम श्रेणी स्ट्रिंगएनग्राम

रैग्ड स्ट्रिंग डेटा से एनग्राम बनाता है।

यह ऑप एक रैग्ड टेंसर को स्वीकार करता है जिसमें 1 रैग्ड आयाम होता है जिसमें केवल स्ट्रिंग्स होती हैं और एक रैग्ड टेंसर को 1 रैग्ड आयाम के साथ आउटपुट करता है जिसमें उस स्ट्रिंग के एनग्राम होते हैं, जो अंतरतम अक्ष के साथ जुड़े होते हैं।

सार्वजनिक तरीके

स्थिर <टी संख्या बढ़ाता है> स्ट्रिंगएनग्राम <टी>
बनाएं ( स्कोप स्कोप, ऑपरेंड <स्ट्रिंग> डेटा, ऑपरेंड <T> डेटास्प्लिट्स, स्ट्रिंग सेपरेटर, लिस्ट <लॉन्ग> ngramWidths, स्ट्रिंग लेफ्टपैड, स्ट्रिंग राइटपैड, लॉन्ग पैडविड्थ, बूलियन प्रिजर्वशॉर्टसीक्वेंस)
एक नए स्ट्रिंगएनग्राम ऑपरेशन को लपेटकर एक क्लास बनाने की फ़ैक्टरी विधि।
आउटपुट <स्ट्रिंग>
एनग्राम ()
आउटपुट एनग्राम का मान टेंसर रैग्ड टेंसर है।
आउटपुट <T>
एनग्रामस्प्लिट्स ()
आउटपुट एनग्राम का स्प्लिट टेंसर रैग्ड टेंसर है।

विरासत में मिली विधियाँ

सार्वजनिक तरीके

सार्वजनिक स्थैतिक StringNGrams <T> बनाएं ( स्कोप स्कोप, ऑपरेंड <स्ट्रिंग> डेटा, ऑपरेंड <T> डेटास्प्लिट्स, स्ट्रिंग सेपरेटर, लिस्ट <लॉन्ग> ngramWidths, स्ट्रिंग लेफ्टपैड, स्ट्रिंग राइटपैड, लॉन्ग पैडविड्थ, बूलियन प्रिजर्वशॉर्टसीक्वेंस)

एक नए स्ट्रिंगएनग्राम ऑपरेशन को लपेटकर एक क्लास बनाने की फ़ैक्टरी विधि।

पैरामीटर
दायरा वर्तमान दायरा
डेटा एनग्राम बनाने के लिए रैग्ड स्ट्रिंग टेंसर के मान टेंसर। एक 1D स्ट्रिंग टेंसर होना चाहिए.
डेटाविभाजन एनग्राम बनाने के लिए रैग्ड स्ट्रिंग टेंसर के स्प्लिट्स टेंसर।
सेपरेटर टोकन के तत्वों के बीच जोड़ने के लिए स्ट्रिंग। बिना विभाजक के लिए "" का प्रयोग करें।
ngramविड्थ बनाने के लिए ngrams के आकार.
लेफ्टपैड एनग्राम अनुक्रम के बाईं ओर पैड करने के लिए उपयोग की जाने वाली स्ट्रिंग। केवल तभी उपयोग किया जाता है जब पैड_विड्थ != 0.
राइटपैड एनग्राम अनुक्रम के दाईं ओर पैड करने के लिए उपयोग की जाने वाली स्ट्रिंग। केवल तभी उपयोग किया जाता है जब पैड_विड्थ != 0.
पैडविड्थ प्रत्येक अनुक्रम के प्रत्येक पक्ष में जोड़े जाने वाले पैडिंग तत्वों की संख्या। ध्यान दें कि इस मान की परवाह किए बिना पैडिंग कभी भी 'ngram_widths'-1 से अधिक नहीं होगी। यदि `pad_width=-1`, तो `max(ngram_widths)-1` तत्व जोड़ें।
रिटर्न
  • StringNGrams का एक नया उदाहरण

सार्वजनिक आउटपुट <स्ट्रिंग> एनग्राम ()

आउटपुट एनग्राम का मान टेंसर रैग्ड टेंसर है।

सार्वजनिक आउटपुट <T> ngramsSplits ()

आउटपुट एनग्राम का स्प्लिट टेंसर रैग्ड टेंसर है।