UnicodeEncode

UnicodeEncode public final class

Codifica un tensor de ints en cadenas unicode.

Devuelve un vector de cadenas, donde `salida [i]` se construye codificando los puntos de código Unicode en `input_values ​​[input_splits [i]: input_splits [i + 1]]` usando `output_encoding`.

---

Ejemplo:

input_values = [72, 101, 108, 108, 111, 87, 111, 114, 108, 100]
 input_splits = [0, 5, 10]
 output_encoding = 'UTF-8'
 
 output = ['Hello', 'World']
 

Clases anidadas

clase UnicodeEncode.Options Los atributos opcionales para UnicodeEncode

Métodos públicos

Salida <String>
asOutput ()
Devuelve el identificador simbólico de un tensor.
estática <T se extiende Número> UnicodeEncode
crear ( Alcance alcance, operando <Integer> IngresarValores, operando <T> inputSplits, Cadena OutputEncoding, Opciones ... Opciones)
Método de fábrica para crear una clase que envuelva una nueva operación UnicodeEncode.
estáticas UnicodeEncode.Options
errores (errores de Cuerda)
Salida <String>
salida ()
El tensor 1-D de cadenas codificadas a partir de los puntos de código Unicode proporcionados.
estáticas UnicodeEncode.Options
replacementChar (Long replacementChar)

Métodos heredados

Métodos públicos

pública de salida <String> asOutput ()

Devuelve el identificador simbólico de un tensor.

Las entradas a las operaciones de TensorFlow son salidas de otra operación de TensorFlow. Este método se utiliza para obtener un identificador simbólico que representa el cálculo de la entrada.

public static UnicodeEncode crear ( Alcance alcance, operando <entero> IngresarValores, operando <T> inputSplits, Cadena OutputEncoding, Opciones ... Opciones)

Método de fábrica para crear una clase que envuelva una nueva operación UnicodeEncode.

Parámetros
alcance alcance actual
inputValues Un tensor 1D que contiene los puntos de código Unicode que deben codificarse.
inputSplits Un tensor 1D que especifica cómo los puntos de código Unicode deben dividirse en cadenas. En particular, `salida [i]` se construye codificando los puntos de código en el segmento `input_values ​​[input_splits [i]: input_splits [i + 1]]`.
outputEncoding Codificación Unicode de las cadenas de salida. Las codificaciones válidas son: "" UTF-8 "," UTF-16-BE "y" UTF-32-BE "`.
opciones lleva valores de atributos opcionales
Devoluciones
  • una nueva instancia de UnicodeEncode

estáticas pública UnicodeEncode.Options errores (errores de Cuerda)

Parámetros
errores Política de manejo de errores cuando se encuentra un formato no válido en la entrada. El valor de 'estricto' hará que la operación produzca un error de argumento no válido en cualquier formato de entrada no válido. Un valor de 'reemplazar' (el predeterminado) hará que la operación reemplace cualquier formato inválido en la entrada con el punto de código `reemplazo_car`. Un valor de 'ignorar' hará que la operación omita cualquier formato no válido en la entrada y no produzca ningún carácter de salida correspondiente.

pública de salida <String> salida ()

El tensor 1-D de cadenas codificadas a partir de los puntos de código Unicode proporcionados.

public static UnicodeEncode.Options replacementChar (Long replacementChar)

Parámetros
reemplazoChar El punto de código de carácter de reemplazo que se utilizará en lugar de cualquier formato no válido en la entrada cuando `errors = 'replace'`. Se puede utilizar cualquier punto de código Unicode válido. El valor predeterminado es el carácter de reemplazo Unicode predeterminado es 0xFFFD (U + 65533).