UnicodeEncode

classe final pública UnicodeEncode

Codifique um tensor de ints em strings unicode.

Retorna um vetor de strings, onde `output[i]` é construído codificando os codepoints Unicode em `input_values[input_splits[i]:input_splits[i+1]]` usando `output_encoding`.

---

Exemplo:

input_values = [72, 101, 108, 108, 111, 87, 111, 114, 108, 100]
 input_splits = [0, 5, 10]
 output_encoding = 'UTF-8'
 
 output = ['Hello', 'World']
 

Classes aninhadas

aula UnicodeEncode.Options Atributos opcionais para UnicodeEncode

Métodos públicos

Saída <String>
comoSaída ()
Retorna o identificador simbólico de um tensor.
estático <T estende o número> UnicodeEncode
create ( Escopo do escopo, Operando <Integer> inputValues, Operando <T> inputSplits, String outputEncoding, Options... options)
Método de fábrica para criar uma classe que envolve uma nova operação UnicodeEncode.
estático UnicodeEncode.Options
erros (erros de string)
Saída <String>
saída ()
O tensor 1-D de strings codificados a partir dos pontos de código unicode fornecidos.
estático UnicodeEncode.Options
substituiçãoChar (Longa substituiçãoChar)

Métodos Herdados

Métodos públicos

Public Output <String> asOutput ()

Retorna o identificador simbólico de um tensor.

As entradas para operações do TensorFlow são saídas de outra operação do TensorFlow. Este método é usado para obter um identificador simbólico que representa o cálculo da entrada.

public static UnicodeEncode create ( Escopo do escopo, Operando <Integer> inputValues, Operando <T> inputSplits, String outputEncoding, Options... options)

Método de fábrica para criar uma classe que envolve uma nova operação UnicodeEncode.

Parâmetros
alcance escopo atual
valores de entrada Um tensor 1D contendo os codepoints unicode que devem ser codificados.
divisões de entrada Um tensor 1D especificando como os codepoints unicode devem ser divididos em strings. Em particular, `output[i]` é construído codificando os codepoints na fatia `input_values[input_splits[i]:input_splits[i+1]]`.
Codificação de saída Codificação Unicode das strings de saída. As codificações válidas são: `"UTF-8", "UTF-16-BE" e "UTF-32-BE"`.
opções carrega valores de atributos opcionais
Devoluções
  • uma nova instância de UnicodeEncode

Erros públicos estáticos UnicodeEncode.Options ( erros de string)

Parâmetros
erros Política de tratamento de erros quando há formatação inválida encontrada na entrada. O valor de 'strict' fará com que a operação produza um erro InvalidArgument em qualquer formatação de entrada inválida. Um valor de 'replace' (o padrão) fará com que a operação substitua qualquer formatação inválida na entrada pelo codepoint `replacement_char`. Um valor de 'ignore' fará com que a operação ignore qualquer formatação inválida na entrada e não produza nenhum caractere de saída correspondente.

saída pública <String> saída ()

O tensor 1-D de strings codificados a partir dos pontos de código unicode fornecidos.

public static UnicodeEncode.Options replaceChar ( Long replaceChar)

Parâmetros
substituiçãoChar O codepoint de caractere de substituição a ser usado no lugar de qualquer formatação inválida na entrada quando `errors='replace'`. Qualquer ponto de código unicode válido pode ser usado. O valor padrão é o caractere de substituição unicode padrão é 0xFFFD (U+65533).