텐서플로우:: 작전:: 유니코드트랜스코드:: 속성

#include <string_ops.h>

UnicodeTranscode 에 대한 선택적 속성 설정자입니다.

요약

공개 속성

errors_ = "replace"
StringPiece
replace_control_characters_ = false
bool
replacement_char_ = 65533
int64

공공 기능

Errors (StringPiece x)
TF_MUST_USE_RESULT Attrs
입력에 잘못된 형식이 있는 경우 오류 처리 정책입니다.
ReplaceControlCharacters (bool x)
TF_MUST_USE_RESULT Attrs
C0 제어 문자(00-1F)를 replacement_char 로 바꿀지 여부입니다.
ReplacementChar (int64 x)
TF_MUST_USE_RESULT Attrs
errors='replace' 일 때 입력의 유효하지 않은 형식화 대신 사용할 대체 문자 코드포인트입니다.

공개 속성

오류_

StringPiece tensorflow::ops::UnicodeTranscode::Attrs::errors_ = "replace"

교체_제어_문자_

bool tensorflow::ops::UnicodeTranscode::Attrs::replace_control_characters_ = false

교체_문자_

int64 tensorflow::ops::UnicodeTranscode::Attrs::replacement_char_ = 65533

공공 기능

오류

TF_MUST_USE_RESULT Attrs tensorflow::ops::UnicodeTranscode::Attrs::Errors(
  StringPiece x
)

입력에 잘못된 형식이 있는 경우 오류 처리 정책입니다.

'strict' 값을 사용하면 잘못된 입력 형식에 대해 작업에서 InvalidArgument 오류가 생성됩니다. 'replace' 값(기본값)을 사용하면 작업이 입력의 잘못된 형식을 replacement_char 코드 포인트로 대체합니다. 'ignore' 값을 사용하면 작업이 입력에서 잘못된 형식을 건너뛰고 해당 출력 문자가 생성되지 않습니다.

기본값은 "교체"입니다.

ControlCharacters 교체

TF_MUST_USE_RESULT Attrs tensorflow::ops::UnicodeTranscode::Attrs::ReplaceControlCharacters(
  bool x
)

C0 제어 문자(00-1F)를 replacement_char 로 바꿀지 여부입니다.

기본값은 거짓입니다.

기본값은 거짓

교체문자

TF_MUST_USE_RESULT Attrs tensorflow::ops::UnicodeTranscode::Attrs::ReplacementChar(
  int64 x
)

errors='replace' 일 때 입력의 유효하지 않은 형식화 대신 사용할 대체 문자 코드포인트입니다.

유효한 유니코드 코드 포인트를 사용할 수 있습니다. 기본값은 기본 유니코드 대체 문자가 0xFFFD 또는 U+65533입니다.)

UTF-8의 경우 ' '와 같이 1바이트로 표현 가능한 대체 문자를 전달하면 잘못된 바이트가 1바이트 대체 문자로 대체되므로 소스에 대한 문자열 정렬이 유지됩니다. UTF-16-BE 및 UTF-16-LE의 경우 1바이트 또는 2바이트 대체 문자는 소스에 대한 바이트 정렬을 유지합니다.

기본값은 65533입니다.