UnicodeEncode

publiczna klasa końcowa UnicodeEncode

Zakoduj tensor int w ciągi znaków Unicode.

Zwraca wektor ciągów znaków, gdzie „wyjście[i]” jest konstruowane poprzez zakodowanie punktów kodowych Unicode w „wartości_wejściowe[podział_wejściowy[i]:rozdział_wejściowy[i+1]]” przy użyciu `kodowania_wyjściowego`.

---

Przykład:

input_values = [72, 101, 108, 108, 111, 87, 111, 114, 108, 100]
 input_splits = [0, 5, 10]
 output_encoding = 'UTF-8'
 
 output = ['Hello', 'World']
 

Klasy zagnieżdżone

klasa Opcje UnicodeEncode Opcjonalne atrybuty dla UnicodeEncode

Metody publiczne

Wyjście <Ciąg>
jako wyjście ()
Zwraca symboliczny uchwyt tensora.
statyczny <T rozszerza numer> UnicodeEncode
utwórz ( Zakres zakresu, Operand <Integer> inputValues, Operand <T> inputSplits, String OutputEncoding, Opcje... opcje)
Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację UnicodeEncode.
statyczne UnicodeEncode.Options
błędy (błędy ciągu)
Wyjście <Ciąg>
wyjście ()
Tensor 1-D ciągów zakodowanych na podstawie podanych punktów kodowych Unicode.
statyczne UnicodeEncode.Options
wymianaChar (długa wymianaChar)

Metody dziedziczone

Metody publiczne

publiczne wyjście <String> asOutput ()

Zwraca symboliczny uchwyt tensora.

Dane wejściowe operacji TensorFlow są wynikami innej operacji TensorFlow. Ta metoda służy do uzyskania symbolicznego uchwytu reprezentującego obliczenia danych wejściowych.

public static UnicodeEncode create ( Zakres zakresu, Operand <Integer> inputValues, Operand <T> inputSplits, String OutputEncoding, Opcje... opcje)

Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację UnicodeEncode.

Parametry
zakres aktualny zakres
Wartości wejściowe Tensor 1D zawierający punkty kodowe Unicode, które powinny zostać zakodowane.
wejściePodziały Tensor 1D określający, w jaki sposób punkty kodowe Unicode powinny być dzielone na ciągi. W szczególności „wyjście[i]” jest konstruowane poprzez zakodowanie punktów kodowych w wycinku „wartości_wejściowe[podział_wejściowy[i]:podział_wejściowy[i+1]]”.
kodowanie wyjściowe Kodowanie Unicode ciągów wyjściowych. Prawidłowe kodowania to: `„UTF-8”, „UTF-16-BE” i „UTF-32-BE”`.
opcje przenosi opcjonalne wartości atrybutów
Zwroty
  • nowa instancja UnicodeEncode

publiczne błędy statyczne UnicodeEncode.Options (błędy ciągu)

Parametry
błędy Zasady obsługi błędów w przypadku znalezienia nieprawidłowego formatowania na wejściu. Wartość „strict” spowoduje, że operacja wygeneruje błąd InvalidArgument w przypadku nieprawidłowego formatowania danych wejściowych. Wartość 'replace' (domyślna) spowoduje, że operacja zastąpi wszelkie nieprawidłowe formatowanie danych wejściowych punktem kodowym `replacement_char`. Wartość „ignore” spowoduje, że operacja pominie wszelkie nieprawidłowe formatowanie na wejściu i nie wygeneruje odpowiedniego znaku wyjściowego.

publiczne wyjście <String> wyjście ()

Tensor 1-D ciągów zakodowanych na podstawie podanych punktów kodowych Unicode.

public static UnicodeEncode.Options zamianaChar (długa zamianaChar)

Parametry
wymianaChar Punkt kodowy znaku zastępczego, który ma zostać użyty zamiast nieprawidłowego formatowania danych wejściowych, gdy `błędy='zamień'`. Można zastosować dowolny ważny punkt kodowy Unicode. Wartość domyślna to domyślny znak zastępczy Unicode to 0xFFFD (U+65533).