UnicodeEncode

کلاس نهایی عمومی UnicodeEncode

یک تانسور از ints را در رشته های یونیکد رمزگذاری کنید.

بردار رشته‌ها را برمی‌گرداند، جایی که «خروجی[i]» با رمزگذاری نقاط کد یونیکد در «مقدارهای_ورودی[شکاف_های_ورودی[i]:input_splits[i+1]]» با استفاده از «کدگذاری_خروجی» ساخته می‌شود.

---

مثال:

input_values = [72, 101, 108, 108, 111, 87, 111, 114, 108, 100]
 input_splits = [0, 5, 10]
 output_encoding = 'UTF-8'
 
 output = ['Hello', 'World']
 

کلاس های تو در تو

کلاس UnicodeEncode.Options ویژگی های اختیاری برای UnicodeEncode

روش های عمومی

خروجی <String>
asOutput ()
دسته نمادین یک تانسور را برمی‌گرداند.
استاتیک <T تعداد را گسترش می دهد> UnicodeEncode
ایجاد ( دامنه دامنه ، عملوند <Integer> inputValues، Operand <T> inputSplits، String outputEncoding، Options... گزینه‌ها)
روش کارخانه برای ایجاد کلاسی که یک عملیات UnicodeEncode جدید را بسته بندی می کند.
استاتیک UnicodeEncode.Options
خطاها (خطاهای رشته ای)
خروجی <String>
خروجی ()
تانسور 1 بعدی رشته ها کدگذاری شده از نقاط کد یونیکد ارائه شده.
استاتیک UnicodeEncode.Options
جایگزینی Char (Long replacementChar)

روش های ارثی

روش های عمومی

خروجی عمومی <String> asOutput ()

دسته نمادین یک تانسور را برمی‌گرداند.

ورودی های عملیات TensorFlow خروجی های عملیات تنسورفلو دیگر هستند. این روش برای به دست آوردن یک دسته نمادین که نشان دهنده محاسبه ورودی است استفاده می شود.

ایجاد UnicodeEncode ایستا عمومی (حوزه دامنه ، عملوند <Integer> inputValues، Operand <T> inputSplits، String outputEncoding، Options... گزینه‌ها)

روش کارخانه برای ایجاد کلاسی که یک عملیات UnicodeEncode جدید را بسته بندی می کند.

مولفه های
محدوده محدوده فعلی
مقادیر ورودی یک تانسور 1 بعدی حاوی کدهای یونیکد که باید کدگذاری شوند.
inputSplits یک تانسور 1 بعدی که مشخص می کند چگونه نقاط کد یونیکد باید به رشته ها تقسیم شوند. به طور خاص، «خروجی[i]» با رمزگذاری نقاط کد در قطعه «input_values[input_splits[i]:input_splits[i+1]]» ساخته می‌شود.
outputEncoding رمزگذاری یونیکد رشته های خروجی. رمزگذاری‌های معتبر عبارتند از: "UTF-8"، "UTF-16-BE" و "UTF-32-BE"".
گزینه ها مقادیر ویژگی های اختیاری را حمل می کند
برمی گرداند
  • یک نمونه جدید از UnicodeEcode

خطاهای عمومی استاتیک UnicodeEncode.Options (خطاهای رشته ای)

مولفه های
خطاها خط مشی رسیدگی به خطا زمانی که قالب بندی نامعتبر در ورودی یافت می شود. مقدار 'strict' باعث می شود که عملیات خطای InvalidArgument در هر قالب بندی ورودی نامعتبر ایجاد کند. مقدار «replace» (پیش‌فرض) باعث می‌شود که عملیات هر قالب‌بندی نامعتبر در ورودی را با کد «replacement_char» جایگزین کند. مقدار "نادیده گرفتن" باعث می شود عملیات از هر قالب بندی نامعتبر در ورودی صرف نظر کند و هیچ کاراکتر خروجی مربوطه تولید نکند.

خروجی عمومی <رشته> خروجی ()

تانسور 1 بعدی رشته ها کدگذاری شده از نقاط کد یونیکد ارائه شده.

عمومی استاتیک UnicodeEncode.Options replacementChar (Long replacementChar)

مولفه های
جایگزینی Char نقطه کد کاراکتر جایگزین برای استفاده به جای هر قالب بندی نامعتبر در ورودی در هنگام `errors='replace'`. ممکن است از هر نقطه کد یونیکد معتبر استفاده شود. مقدار پیش‌فرض این است که کاراکتر جایگزین یونیکد پیش‌فرض 0xFFFD (U+65533) است.