یک تانسور از اینت ها را در رشته های یونیکد رمزگذاری کنید.
بردار رشتهها را برمیگرداند، جایی که «خروجی[i]» با رمزگذاری نقاط کد یونیکد در «input_values[input_splits[i]:input_splits[i+1]]» با استفاده از «output_encoding» ساخته میشود.
---
به عنوان مثال:
input_values = [72, 101, 108, 108, 111, 87, 111, 114, 108, 100]
input_splits = [0, 5, 10]
output_encoding = 'UTF-8'
output = ['Hello', 'World']
کلاس های تو در تو
کلاس | UnicodeEncode.Options | ویژگی اختیاری برای UnicodeEncode |
روش های عمومی
خروجی <رشته> | asOutput () دسته نمادین یک تانسور را برمیگرداند. |
شخص <T گسترش تعداد> UnicodeEncode | ایجاد ( محدوده دامنه، عملوند <صحیح> inputValues، عملوند <T> inputSplits، رشته outputEncoding، گزینه ها ... گزینه ها) روش کارخانه برای ایجاد کلاسی که یک عملیات UnicodeEncode جدید را بسته بندی می کند. |
شخص UnicodeEncode.Options | اشتباهات (خطاهای رشته) |
خروجی <رشته> | خروجی () تانسور 1 بعدی رشته ها کدگذاری شده از نقاط کد یونیکد ارائه شده. |
شخص UnicodeEncode.Options | replacementChar (بلند replacementChar) |
روش های ارثی
روش های عمومی
عمومی خروجی <رشته> asOutput ()
دسته نمادین یک تانسور را برمیگرداند.
ورودی های عملیات TensorFlow خروجی های عملیات تنسورفلو دیگر هستند. این روش برای به دست آوردن یک دسته نمادین که نشان دهنده محاسبه ورودی است استفاده می شود.
عمومی استاتیک UnicodeEncode ایجاد ( محدوده دامنه، عملوند <صحیح> inputValues، عملوند <T> inputSplits، رشته outputEncoding، گزینه ها ... گزینه ها)
روش کارخانه برای ایجاد کلاسی که یک عملیات UnicodeEncode جدید را بسته بندی می کند.
مولفه های
محدوده | محدوده فعلی |
---|---|
مقادیر ورودی | یک تانسور 1 بعدی حاوی کدهای یونیکد که باید کدگذاری شوند. |
inputSplits | یک تانسور 1 بعدی که مشخص می کند چگونه نقاط کد یونیکد باید به رشته ها تقسیم شوند. به طور خاص، «خروجی[i]» با رمزگذاری نقاط کد در برش «input_values[input_splits[i]:input_splits[i+1]]» ساخته میشود. |
outputEncoding | رمزگذاری یونیکد رشته های خروجی. رمزگذاریهای معتبر عبارتند از: «UTF-8»، «UTF-16-BE» و «UTF-32-BE». |
گزینه ها | مقادیر ویژگی های اختیاری را حمل می کند |
برمی گرداند
- یک نمونه جدید از UnicodeEcode
عمومی استاتیک UnicodeEncode.Options اشتباهات (خطاهای رشته)
مولفه های
خطاها | خطمشی رسیدگی به خطا زمانی که قالببندی نامعتبر در ورودی یافت میشود. مقدار 'strict' باعث می شود که عملیات یک خطای InvalidArgument در هر قالب بندی ورودی نامعتبر ایجاد کند. مقدار «replace» (پیشفرض) باعث میشود که عملیات هر قالببندی نامعتبر در ورودی را با کد «replacement_char» جایگزین کند. مقدار "نادیده گرفتن" باعث می شود عملیات از هر قالب بندی نامعتبر در ورودی صرف نظر کند و هیچ کاراکتر خروجی مربوطه تولید نکند. |
---|
عمومی استاتیک UnicodeEncode.Options replacementChar (بلند replacementChar)
مولفه های
جایگزینی Char | نقطه کد کاراکتر جایگزین برای استفاده به جای هر قالب بندی نامعتبر در ورودی در هنگام `errors='replace'`. ممکن است از هر کد یونیکد معتبری استفاده شود. مقدار پیشفرض این است که کاراکتر جایگزینی پیشفرض یونیکد 0xFFFD (U+65533) است. |
---|