इनट्स के टेंसर को यूनिकोड स्ट्रिंग्स में एनकोड करें।
स्ट्रिंग्स का एक वेक्टर लौटाता है, जहां `output_encoding` का उपयोग करके `input_values[input_splits[i]:input_splits[i+1]]` में यूनिकोड कोडपॉइंट को एन्कोड करके `output[i]` का निर्माण किया जाता है।
---
उदाहरण:
input_values = [72, 101, 108, 108, 111, 87, 111, 114, 108, 100]
input_splits = [0, 5, 10]
output_encoding = 'UTF-8'
output = ['Hello', 'World']
नेस्टेड कक्षाएं
कक्षा | यूनिकोडएनकोड।विकल्प | के लिए वैकल्पिक विशेषताओं UnicodeEncode |
सार्वजनिक तरीके
आउटपुट <string> | asOutput () टेंसर का प्रतीकात्मक हैंडल लौटाता है। |
स्थिर <टी फैली संख्या> UnicodeEncode | बनाने ( स्कोप गुंजाइश, ओपेरैंड <पूर्णांक> inputValues, ओपेरैंड <टी> inputSplits, स्ट्रिंग outputEncoding, विकल्प ... विकल्प) एक नया यूनिकोडएनकोड ऑपरेशन रैपिंग क्लास बनाने के लिए फ़ैक्टरी विधि। |
स्थिर UnicodeEncode.Options | त्रुटियों (स्ट्रिंग त्रुटियों) |
आउटपुट <string> | उत्पादन () स्ट्रिंग्स का 1-डी टेंसर प्रदान किए गए यूनिकोड कोडपॉइंट से एन्कोड किया गया है। |
स्थिर UnicodeEncode.Options | replacementChar (लांग replacementChar) |
विरासत में मिली विधियां
सार्वजनिक तरीके
सार्वजनिक आउटपुट <string> asOutput ()
टेंसर का प्रतीकात्मक हैंडल लौटाता है।
TensorFlow संचालन के लिए इनपुट एक अन्य TensorFlow ऑपरेशन के आउटपुट हैं। इस पद्धति का उपयोग एक प्रतीकात्मक हैंडल प्राप्त करने के लिए किया जाता है जो इनपुट की गणना का प्रतिनिधित्व करता है।
सार्वजनिक स्थिर UnicodeEncode बनाने ( स्कोप गुंजाइश, ओपेरैंड <पूर्णांक> inputValues, ओपेरैंड <टी> inputSplits, स्ट्रिंग outputEncoding, विकल्प ... विकल्प)
एक नया यूनिकोडएनकोड ऑपरेशन रैपिंग क्लास बनाने के लिए फ़ैक्टरी विधि।
मापदंडों
दायरा | वर्तमान दायरा |
---|---|
इनपुट मान | एक 1D टेंसर जिसमें यूनिकोड कोडपॉइंट होते हैं जिन्हें एन्कोड किया जाना चाहिए। |
इनपुटस्प्लिट्स | एक 1D टेंसर निर्दिष्ट करता है कि यूनिकोड कोडपॉइंट को स्ट्रिंग्स में कैसे विभाजित किया जाना चाहिए। विशेष रूप से, `आउटपुट [i]` का निर्माण कोडपॉइंट्स को स्लाइस `input_values[input_splits[i]:input_splits[i+1]]` में एन्कोड करके किया जाता है। |
आउटपुट एन्कोडिंग | आउटपुट स्ट्रिंग्स का यूनिकोड एन्कोडिंग। मान्य एन्कोडिंग हैं: `"UTF-8", "UTF-16-BE", और "UTF-32-BE"`। |
विकल्प | वैकल्पिक विशेषता मान रखता है |
रिटर्न
- यूनिकोडएनकोड का एक नया उदाहरण
सार्वजनिक स्थिर UnicodeEncode.Options त्रुटियों (स्ट्रिंग त्रुटियों)
मापदंडों
त्रुटियों | इनपुट में अमान्य स्वरूपण पाए जाने पर त्रुटि प्रबंधन नीति। 'सख्त' का मान ऑपरेशन को किसी भी अमान्य इनपुट स्वरूपण पर अमान्य आर्ग्यूमेंट त्रुटि उत्पन्न करने का कारण बनता है। 'बदलें' (डिफ़ॉल्ट) का मान ऑपरेशन को इनपुट में किसी भी अमान्य स्वरूपण को 'replacement_char' कोडपॉइंट से बदलने का कारण बनेगा। 'अनदेखा' का मान ऑपरेशन को इनपुट में किसी भी अमान्य स्वरूपण को छोड़ देगा और कोई संबंधित आउटपुट वर्ण उत्पन्न नहीं करेगा। |
---|
सार्वजनिक आउटपुट <string> निर्गम ()
स्ट्रिंग्स का 1-डी टेंसर प्रदान किए गए यूनिकोड कोडपॉइंट से एन्कोड किया गया है।
सार्वजनिक स्थिर UnicodeEncode.Options replacementChar (लांग replacementChar)
मापदंडों
प्रतिस्थापनचार | 'त्रुटियों = 'प्रतिस्थापन'' होने पर इनपुट में किसी भी अमान्य स्वरूपण के स्थान पर उपयोग किए जाने वाले प्रतिस्थापन वर्ण कोडपॉइंट। किसी भी वैध यूनिकोड कोडपॉइंट का उपयोग किया जा सकता है। डिफ़ॉल्ट मान डिफ़ॉल्ट यूनिकोड प्रतिस्थापन वर्ण है 0xFFFD (U+65533)। |
---|