UnicodeEncode

classe final pública UnicodeEncode

Codifique um tensor de inteiros em strings Unicode.

Retorna um vetor de strings, onde `output[i]` é construído codificando os pontos de código Unicode em `input_values[input_splits[i]:input_splits[i+1]]` usando `output_encoding`.

---

Exemplo:

input_values = [72, 101, 108, 108, 111, 87, 111, 114, 108, 100]
 input_splits = [0, 5, 10]
 output_encoding = 'UTF-8'
 
 output = ['Hello', 'World']
 

Classes aninhadas

aula UnicodeEncode.Opções Atributos opcionais para UnicodeEncode

Métodos Públicos

Saída <String>
asOutput ()
Retorna o identificador simbólico de um tensor.
estático <T estende número> UnicodeEncode
create ( Escopo , Operando <Integer> inputValues, Operando <T> inputSplits, String outputEncoding, Opções... opções)
Método de fábrica para criar uma classe que envolve uma nova operação UnicodeEncode.
UnicodeEncode.Options estático
erros (erros de string)
Saída <String>
saída ()
O tensor 1-D de strings codificadas a partir dos pontos de código unicode fornecidos.
UnicodeEncode.Options estático
replacementChar (substituição longaChar)

Métodos herdados

Métodos Públicos

Saída pública <String> asOutput ()

Retorna o identificador simbólico de um tensor.

As entradas para operações do TensorFlow são saídas de outra operação do TensorFlow. Este método é usado para obter um identificador simbólico que representa o cálculo da entrada.

public static UnicodeEncode create ( Escopo escopo , Operando <Integer> inputValues, Operando <T> inputSplits, String outputEncoding, Opções... opções)

Método de fábrica para criar uma classe que envolve uma nova operação UnicodeEncode.

Parâmetros
escopo escopo atual
valores de entrada Um tensor 1D contendo os pontos de código Unicode que devem ser codificados.
inputSplits Um tensor 1D que especifica como os pontos de código Unicode devem ser divididos em strings. Em particular, `output[i]` é construído codificando os pontos de código na fatia `input_values[input_splits[i]:input_splits[i+1]]`.
codificação de saída Codificação Unicode das strings de saída. As codificações válidas são: `"UTF-8", "UTF-16-BE" e "UTF-32-BE"`.
opções carrega valores de atributos opcionais
Devoluções
  • uma nova instância de UnicodeEncode

Erros públicos estáticos de UnicodeEncode.Options (erros de string)

Parâmetros
erros Política de tratamento de erros quando há formatação inválida encontrada na entrada. O valor de 'strict' fará com que a operação produza um erro InvalidArgument em qualquer formatação de entrada inválida. Um valor 'replace' (o padrão) fará com que a operação substitua qualquer formatação inválida na entrada pelo codepoint `replacement_char`. Um valor 'ignorar' fará com que a operação ignore qualquer formatação inválida na entrada e não produza nenhum caractere de saída correspondente.

Saída pública <String> saída ()

O tensor 1-D de strings codificadas a partir dos pontos de código unicode fornecidos.

público estático UnicodeEncode.Options replacementChar (substituição longaChar)

Parâmetros
substituiçãoChar O ponto de código do caractere de substituição a ser usado no lugar de qualquer formatação inválida na entrada quando `errors='replace'`. Qualquer ponto de código Unicode válido pode ser usado. O valor padrão é que o caractere de substituição unicode padrão é 0xFFFD (U+65533).