עזרה להגן על שונית המחסום הגדולה עם TensorFlow על Kaggle הצטרפו אתגר

זרימת טנסור :: אופ :: UnicodeTranscode :: עו"ד

#include <string_ops.h>

קובעי תכונות אופציונליים עבור UnicodeTranscode .

סיכום

תכונות ציבוריות

errors_ = "replace"
StringPiece
replace_control_characters_ = false
bool
replacement_char_ = 65533
int64

פונקציות ציבוריות

Errors (StringPiece x)
TF_MUST_USE_RESULT Attrs
מדיניות טיפול בשגיאות כאשר נמצא קלט בעיצוב לא חוקי.
ReplaceControlCharacters (bool x)
TF_MUST_USE_RESULT Attrs
האם להחליף את תווי הבקרה C0 (00-1F) בתמורה replacement_char .
ReplacementChar (int64 x)
TF_MUST_USE_RESULT Attrs
קוד התו החלופי שישמש במקום כל עיצוב לא חוקי בקלט כאשר errors='replace' .

תכונות ציבוריות

שגיאות_

StringPiece tensorflow::ops::UnicodeTranscode::Attrs::errors_ = "replace"

החלף_בקרה_דמויות_

bool tensorflow::ops::UnicodeTranscode::Attrs::replace_control_characters_ = false

החלפת_של_

int64 tensorflow::ops::UnicodeTranscode::Attrs::replacement_char_ = 65533

פונקציות ציבוריות

טעויות

TF_MUST_USE_RESULT Attrs tensorflow::ops::UnicodeTranscode::Attrs::Errors(
  StringPiece x
)

מדיניות טיפול בשגיאות כאשר נמצא קלט בעיצוב לא חוקי.

הערך של 'קפדני' יגרום לפעולה לייצר שגיאת InvalidArgument בכל עיצוב קלט לא חוקי. ערך "להחליף" (ברירת המחדל) יגרום המבצע להחליף עיצוב כלשהו שאינו חוקי קלט עם replacement_char codepoint. ערך של 'התעלם' יגרום לפעולה לדלג על כל עיצוב לא חוקי בקלט ולא לייצר שום תו פלט מתאים.

ברירת המחדל היא "להחליף"

ReplaceControlCharacters

TF_MUST_USE_RESULT Attrs tensorflow::ops::UnicodeTranscode::Attrs::ReplaceControlCharacters(
  bool x
)

האם להחליף את תווי הבקרה C0 (00-1F) בתמורה replacement_char .

ברירת המחדל היא שקר.

ברירת המחדל היא שקר

החלפת צ'אר

TF_MUST_USE_RESULT Attrs tensorflow::ops::UnicodeTranscode::Attrs::ReplacementChar(
  int64 x
)

קוד התו החלופי שישמש במקום כל עיצוב לא חוקי בקלט כאשר errors='replace' .

ניתן להשתמש בכל קוד קוד unicode תקף. ערך ברירת המחדל הוא תו החלפת ה- Unicode המוגדר כברירת מחדל הוא 0xFFFD או U + 65533.)

שים לב כי עבור UTF-8, העברת תו חלופי שניתן לבטא בבת אחת, כגון '', תשמור על יישור המחרוזות למקור מכיוון שבתים לא חוקיים יוחלפו בהחלפה של 1 בת. עבור UTF-16-BE ו- UTF-16-LE, כל תו החלפה של 1 או 2 בתים ישמור על יישור בתים למקור.

ברירת המחדל היא 65533