Aviso: esta API está obsoleta e será removida em uma versão futura do TensorFlow depois que a substituição estiver estável.

UnicodeEncode

classe final pública UnicodeEncode

Codifique um tensor de ints em strings Unicode.

Retorna um vetor de strings, onde `output [i]` é construído codificando os pontos de código Unicode em `input_values ​​[input_splits [i]: input_splits [i + 1]]` usando `output_encoding`.

---

Exemplo:

input_values = [72, 101, 108, 108, 111, 87, 111, 114, 108, 100]
 input_splits = [0, 5, 10]
 output_encoding = 'UTF-8'
 
 output = ['Hello', 'World']
 

Classes aninhadas

aula UnicodeEncode.Options Atributos opcionais para UnicodeEncode

Métodos Públicos

Saída <>
asOutput ()
Retorna o identificador simbólico de um tensor.
static <T extends Number> UnicodeEncode
criar ( Scope escopo, Operando <Integer> inputValues, Operando <T> inputSplits, String OutputEncoding, Options ... Opções)
Método de fábrica para criar uma classe que envolve uma nova operação UnicodeEncode.
static UnicodeEncode.Options
erros ( erros de string)
Saída <>
saída ()
O tensor 1-D de strings codificadas a partir dos pontos de código Unicode fornecidos.
static UnicodeEncode.Options
SubstituiçãoChar (Long replacementChar)

Métodos herdados

Métodos Públicos

public Output <String> asOutput ()

Retorna o identificador simbólico de um tensor.

As entradas para as operações do TensorFlow são saídas de outra operação do TensorFlow. Este método é usado para obter um identificador simbólico que representa o cálculo da entrada.

public static UnicodeEncode criar ( Scope escopo, Operando <inteiro> inputValues, Operando <T> inputSplits, String OutputEncoding, Options ... Opções)

Método de fábrica para criar uma classe que envolve uma nova operação UnicodeEncode.

Parâmetros
alcance escopo atual
inputValues Um tensor 1D contendo os pontos de código Unicode que devem ser codificados.
inputSplits Um tensor 1D especificando como os pontos de código Unicode devem ser divididos em strings. Em particular, `output [i]` é construído codificando os pontos de código na fatia `input_values ​​[input_splits [i]: input_splits [i + 1]]`.
outputEncoding Codificação Unicode das strings de saída. As codificações válidas são: `" UTF-8 "," UTF-16-BE "e" UTF-32-BE "`.
opções carrega valores de atributos opcionais
Devoluções
  • uma nova instância de UnicodeEncode

public static UnicodeEncode.Options errors (String erros)

Parâmetros
erros Política de tratamento de erros quando uma formatação inválida é encontrada na entrada. O valor de 'estrito' fará com que a operação produza um erro InvalidArgument em qualquer formatação de entrada inválida. Um valor de 'substituir' (o padrão) fará com que a operação substitua qualquer formatação inválida na entrada pelo ponto de código `substituição_char`. Um valor de 'ignorar' fará com que a operação ignore qualquer formatação inválida na entrada e não produza nenhum caractere de saída correspondente.

Saída pública <String> output ()

O tensor 1-D de strings codificadas a partir dos pontos de código Unicode fornecidos.

public static UnicodeEncode.Options replacementChar (Long replacementChar)

Parâmetros
SubstituiçãoChar O ponto de código do caractere de substituição a ser usado no lugar de qualquer formatação inválida na entrada quando `errors = 'replace'`. Qualquer ponto de código Unicode válido pode ser usado. O valor padrão é o caractere de substituição Unicode padrão é 0xFFFD (U + 65533).