هشدار: این API منسوخ شده است و پس از پایدار شدن جایگزینی، در نسخه بعدی TensorFlow حذف خواهد شد.

UnicodeEncode

عمومی UnicodeEncode کلاس نهایی

یک تانسور از اینت ها را در رشته های یونیکد رمزگذاری کنید.

بردار رشته‌ها را برمی‌گرداند، جایی که «خروجی[i]» با رمزگذاری نقاط کد یونیکد در «input_values[input_splits[i]:input_splits[i+1]]» با استفاده از «output_encoding» ساخته می‌شود.

---

به عنوان مثال:

input_values = [72, 101, 108, 108, 111, 87, 111, 114, 108, 100]
 input_splits = [0, 5, 10]
 output_encoding = 'UTF-8'
 
 output = ['Hello', 'World']
 

کلاس های تو در تو

کلاس UnicodeEncode.Options ویژگی اختیاری برای UnicodeEncode

روش های عمومی

خروجی <رشته>
asOutput ()
دسته نمادین یک تانسور را برمی‌گرداند.
شخص <T گسترش تعداد> UnicodeEncode
ایجاد ( محدوده دامنه، عملوند <صحیح> inputValues، عملوند <T> inputSplits، رشته outputEncoding، گزینه ها ... گزینه ها)
روش کارخانه برای ایجاد کلاسی که یک عملیات UnicodeEncode جدید را بسته بندی می کند.
شخص UnicodeEncode.Options
اشتباهات (خطاهای رشته)
خروجی <رشته>
خروجی ()
تانسور 1 بعدی رشته ها کدگذاری شده از نقاط کد یونیکد ارائه شده.
شخص UnicodeEncode.Options
replacementChar (بلند replacementChar)

روش های ارثی

روش های عمومی

عمومی خروجی <رشته> asOutput ()

دسته نمادین یک تانسور را برمی‌گرداند.

ورودی های عملیات TensorFlow خروجی های عملیات تنسورفلو دیگر هستند. این روش برای به دست آوردن یک دسته نمادین که نشان دهنده محاسبه ورودی است استفاده می شود.

عمومی استاتیک UnicodeEncode ایجاد ( محدوده دامنه، عملوند <صحیح> inputValues، عملوند <T> inputSplits، رشته outputEncoding، گزینه ها ... گزینه ها)

روش کارخانه برای ایجاد کلاسی که یک عملیات UnicodeEncode جدید را بسته بندی می کند.

مولفه های
محدوده محدوده فعلی
مقادیر ورودی یک تانسور 1 بعدی حاوی کدهای یونیکد که باید کدگذاری شوند.
inputSplits یک تانسور 1 بعدی که مشخص می کند چگونه نقاط کد یونیکد باید به رشته ها تقسیم شوند. به طور خاص، «خروجی[i]» با رمزگذاری نقاط کد در برش «input_values[input_splits[i]:input_splits[i+1]]» ساخته می‌شود.
outputEncoding رمزگذاری یونیکد رشته های خروجی. رمزگذاری‌های معتبر عبارتند از: «UTF-8»، «UTF-16-BE» و «UTF-32-BE».
گزینه ها مقادیر ویژگی های اختیاری را حمل می کند
برمی گرداند
  • یک نمونه جدید از UnicodeEcode

عمومی استاتیک UnicodeEncode.Options اشتباهات (خطاهای رشته)

مولفه های
خطاها خط‌مشی رسیدگی به خطا زمانی که قالب‌بندی نامعتبر در ورودی یافت می‌شود. مقدار 'strict' باعث می شود که عملیات یک خطای InvalidArgument در هر قالب بندی ورودی نامعتبر ایجاد کند. مقدار «replace» (پیش‌فرض) باعث می‌شود که عملیات هر قالب‌بندی نامعتبر در ورودی را با کد «replacement_char» جایگزین کند. مقدار "نادیده گرفتن" باعث می شود عملیات از هر قالب بندی نامعتبر در ورودی صرف نظر کند و هیچ کاراکتر خروجی مربوطه تولید نکند.

عمومی خروجی <رشته> خروجی ()

تانسور 1 بعدی رشته ها کدگذاری شده از نقاط کد یونیکد ارائه شده.

عمومی استاتیک UnicodeEncode.Options replacementChar (بلند replacementChar)

مولفه های
جایگزینی Char نقطه کد کاراکتر جایگزین برای استفاده به جای هر قالب بندی نامعتبر در ورودی در هنگام `errors='replace'`. ممکن است از هر کد یونیکد معتبری استفاده شود. مقدار پیش‌فرض این است که کاراکتر جایگزینی پیش‌فرض یونیکد 0xFFFD (U+65533) است.