جریان تنسور:: عملیات:: Unicode Transcode:: Attrs

#include <string_ops.h>

تنظیم کننده های ویژگی اختیاری برای UnicodeTranscode .

خلاصه

صفات عمومی

errors_ = "replace"
StringPiece
replace_control_characters_ = false
bool
replacement_char_ = 65533
int64

توابع عمومی

Errors (StringPiece x)
TF_MUST_USE_RESULT Attrs
خط مشی رسیدگی به خطا زمانی که قالب بندی نامعتبر در ورودی یافت می شود.
ReplaceControlCharacters (bool x)
TF_MUST_USE_RESULT Attrs
آیا باید نویسه‌های کنترلی C0 (00-1F) را با replacement_char جایگزین کرد.
ReplacementChar (int64 x)
TF_MUST_USE_RESULT Attrs
نقطه کد کاراکتر جایگزین برای استفاده به جای هر قالب بندی نامعتبر در ورودی در هنگام errors='replace' .

صفات عمومی

خطاها_

StringPiece tensorflow::ops::UnicodeTranscode::Attrs::errors_ = "replace"

جایگزین_کنترل_شخصیت_ها

bool tensorflow::ops::UnicodeTranscode::Attrs::replace_control_characters_ = false

جایگزینی_چار_

int64 tensorflow::ops::UnicodeTranscode::Attrs::replacement_char_ = 65533

توابع عمومی

خطاها

TF_MUST_USE_RESULT Attrs tensorflow::ops::UnicodeTranscode::Attrs::Errors(
  StringPiece x
)

خط مشی رسیدگی به خطا زمانی که قالب بندی نامعتبر در ورودی یافت می شود.

مقدار 'strict' باعث می شود که عملیات خطای InvalidArgument در هر قالب بندی ورودی نامعتبر ایجاد کند. مقدار «replace» (پیش‌فرض) باعث می‌شود که عملیات هر قالب‌بندی نامعتبر در ورودی را با نقطه کد replacement_char جایگزین کند. مقدار "نادیده گرفتن" باعث می شود عملیات از هر قالب بندی نامعتبر در ورودی صرف نظر کند و هیچ کاراکتر خروجی مربوطه تولید نکند.

پیش‌فرض‌ها برای «جایگزینی»

ReplaceControl Characters

TF_MUST_USE_RESULT Attrs tensorflow::ops::UnicodeTranscode::Attrs::ReplaceControlCharacters(
  bool x
)

آیا باید نویسه‌های کنترلی C0 (00-1F) را با replacement_char جایگزین کرد.

پیش فرض نادرست است.

پیش فرض به نادرست

Replacement Char

TF_MUST_USE_RESULT Attrs tensorflow::ops::UnicodeTranscode::Attrs::ReplacementChar(
  int64 x
)

نقطه کد کاراکتر جایگزین برای استفاده به جای هر قالب بندی نامعتبر در ورودی در هنگام errors='replace' .

ممکن است از هر نقطه کد یونیکد معتبر استفاده شود. مقدار پیش‌فرض این است که کاراکتر جایگزین یونیکد پیش‌فرض 0xFFFD یا U+65533 است.)

توجه داشته باشید که برای UTF-8، ارسال یک کاراکتر جایگزین قابل بیان در 1 بایت، مانند " "، تراز رشته را با منبع حفظ می کند زیرا بایت های نامعتبر با یک جایگزین 1 بایتی جایگزین می شوند. برای UTF-16-BE و UTF-16-LE، هر نویسه جایگزین 1 یا 2 بایت، تراز بایت را با منبع حفظ می کند.

پیش‌فرض 65533 است