유니코드인코드

공개 최종 클래스 UnicodeEncode

int의 텐서를 유니코드 문자열로 인코딩합니다.

`output_encoding`을 사용하여 `input_values[input_splits[i]:input_splits[i+1]]`의 유니코드 코드 포인트를 인코딩하여 `output[i]`가 생성되는 문자열 벡터를 반환합니다.

---

예:

input_values = [72, 101, 108, 108, 111, 87, 111, 114, 108, 100]
 input_splits = [0, 5, 10]
 output_encoding = 'UTF-8'
 
 output = ['Hello', 'World']
 

중첩 클래스

수업 UnicodeEncode.옵션 UnicodeEncode 의 선택적 속성

공개 방법

출력 <문자열>
출력 ()
텐서의 기호 핸들을 반환합니다.
static <T 확장 번호> UnicodeEncode
생성 ( 범위 범위, 피연산자 <Integer> inputValues, 피연산자 <T> inputSplits, 문자열 출력Encoding, 옵션... 옵션)
새로운 UnicodeEncode 작업을 래핑하는 클래스를 생성하는 팩토리 메서드입니다.
정적 UnicodeEncode.옵션
오류 (문자열 오류)
출력 <문자열>
출력 ()
제공된 유니코드 코드포인트에서 인코딩된 문자열의 1D Tensor입니다.
정적 UnicodeEncode.옵션
replacementChar (긴 replacementChar)

상속된 메서드

공개 방법

공개 출력 <String> asOutput ()

텐서의 기호 핸들을 반환합니다.

TensorFlow 작업에 대한 입력은 다른 TensorFlow 작업의 출력입니다. 이 메서드는 입력 계산을 나타내는 기호 핸들을 얻는 데 사용됩니다.

공개 정적 UnicodeEncode 생성 ( 범위 범위, 피연산자 <Integer> inputValues, 피연산자 <T> inputSplits, 문자열 출력Encoding, 옵션... 옵션)

새로운 UnicodeEncode 작업을 래핑하는 클래스를 생성하는 팩토리 메서드입니다.

매개변수
범위 현재 범위
입력값 인코딩해야 하는 유니코드 코드 포인트를 포함하는 1D 텐서입니다.
입력분할 유니코드 코드 포인트를 문자열로 분할하는 방법을 지정하는 1D 텐서입니다. 특히, `output[i]`는 `input_values[input_splits[i]:input_splits[i+1]]` 슬라이스의 코드 포인트를 인코딩하여 구성됩니다.
출력인코딩 출력 문자열의 유니코드 인코딩. 유효한 인코딩은 `"UTF-8", "UTF-16-BE" 및 "UTF-32-BE"`입니다.
옵션 선택적 속성 값을 전달합니다.
보고
  • UnicodeEncode의 새 인스턴스

공개 정적 UnicodeEncode.Options 오류 (문자열 오류)

매개변수
오류 입력에 잘못된 형식이 있는 경우 오류 처리 정책입니다. 'strict' 값을 사용하면 잘못된 입력 형식에 대해 작업에서 InvalidArgument 오류가 생성됩니다. 'replace' 값(기본값)을 사용하면 입력의 잘못된 형식을 `replacement_char` 코드 포인트로 바꾸는 작업이 수행됩니다. 'ignore' 값을 사용하면 작업이 입력에서 잘못된 형식을 건너뛰고 해당 출력 문자가 생성되지 않습니다.

공개 출력 <String> 출력 ()

제공된 유니코드 코드포인트에서 인코딩된 문자열의 1D Tensor입니다.

공개 정적 UnicodeEncode.Options replacementChar (Long replacementChar)

매개변수
교체문자 `errors='replace'`일 때 입력의 유효하지 않은 형식화 대신 사용할 대체 문자 코드포인트입니다. 유효한 유니코드 코드 포인트를 사용할 수 있습니다. 기본값은 기본 유니코드 대체 문자가 0xFFFD(U+65533)입니다.