Codifique um tensor de ints em strings unicode.
Retorna um vetor de strings, onde `output[i]` é construído codificando os codepoints Unicode em `input_values[input_splits[i]:input_splits[i+1]]` usando `output_encoding`.
---
Exemplo:
input_values = [72, 101, 108, 108, 111, 87, 111, 114, 108, 100]
input_splits = [0, 5, 10]
output_encoding = 'UTF-8'
output = ['Hello', 'World']
Classes aninhadas
aula | UnicodeEncode.Options | Atributos opcionais para UnicodeEncode |
Métodos públicos
Saída <String> | comoSaída () Retorna o identificador simbólico de um tensor. |
estático <T estende o número> UnicodeEncode | create ( Escopo do escopo, Operando <Integer> inputValues, Operando <T> inputSplits, String outputEncoding, Options... options) Método de fábrica para criar uma classe que envolve uma nova operação UnicodeEncode. |
estático UnicodeEncode.Options | erros (erros de string) |
Saída <String> | saída () O tensor 1-D de strings codificados a partir dos pontos de código unicode fornecidos. |
estático UnicodeEncode.Options | substituiçãoChar (Longa substituiçãoChar) |
Métodos Herdados
Métodos públicos
Public Output <String> asOutput ()
Retorna o identificador simbólico de um tensor.
As entradas para operações do TensorFlow são saídas de outra operação do TensorFlow. Este método é usado para obter um identificador simbólico que representa o cálculo da entrada.
public static UnicodeEncode create ( Escopo do escopo, Operando <Integer> inputValues, Operando <T> inputSplits, String outputEncoding, Options... options)
Método de fábrica para criar uma classe que envolve uma nova operação UnicodeEncode.
Parâmetros
alcance | escopo atual |
---|---|
valores de entrada | Um tensor 1D contendo os codepoints unicode que devem ser codificados. |
divisões de entrada | Um tensor 1D especificando como os codepoints unicode devem ser divididos em strings. Em particular, `output[i]` é construído codificando os codepoints na fatia `input_values[input_splits[i]:input_splits[i+1]]`. |
Codificação de saída | Codificação Unicode das strings de saída. As codificações válidas são: `"UTF-8", "UTF-16-BE" e "UTF-32-BE"`. |
opções | carrega valores de atributos opcionais |
Devoluções
- uma nova instância de UnicodeEncode
Erros públicos estáticos UnicodeEncode.Options ( erros de string)
Parâmetros
erros | Política de tratamento de erros quando há formatação inválida encontrada na entrada. O valor de 'strict' fará com que a operação produza um erro InvalidArgument em qualquer formatação de entrada inválida. Um valor de 'replace' (o padrão) fará com que a operação substitua qualquer formatação inválida na entrada pelo codepoint `replacement_char`. Um valor de 'ignore' fará com que a operação ignore qualquer formatação inválida na entrada e não produza nenhum caractere de saída correspondente. |
---|
saída pública <String> saída ()
O tensor 1-D de strings codificados a partir dos pontos de código unicode fornecidos.
public static UnicodeEncode.Options replaceChar ( Long replaceChar)
Parâmetros
substituiçãoChar | O codepoint de caractere de substituição a ser usado no lugar de qualquer formatação inválida na entrada quando `errors='replace'`. Qualquer ponto de código unicode válido pode ser usado. O valor padrão é o caractere de substituição unicode padrão é 0xFFFD (U+65533). |
---|