UnicodeDecode

clase final pública UnicodeDecode

Decodifica cada cadena en `entrada` en una secuencia de puntos de código Unicode.

Los puntos de código de caracteres para todas las cadenas se devuelven utilizando un solo vector `char_values`, con cadenas expandidas a caracteres en orden de fila principal.

El tensor `row_splits` indica dónde comienzan y terminan los puntos de código para cada cadena de entrada dentro del tensor `char_values`. En particular, los valores para la `i`ésima cadena (en orden de fila principal) se almacenan en el segmento `[row_splits[i]:row_splits[i+1]]`. Por lo tanto:

  • `char_values[row_splits[i]+j]` es el punto de código Unicode para el `j`ésimo carácter en la `i`ésima cadena (en orden de fila principal).
  • `row_splits[i+1] - row_splits[i]` es el número de caracteres en la `i`ésima cadena (en orden de fila principal).

Clases anidadas

clase UnicodeDecode.Opciones Atributos opcionales para UnicodeDecode

Métodos públicos

Salida <Entero>
valoreschar ()
Un tensor 1D int32 que contiene los puntos de código decodificados.
estático <T extiende Número> UnicodeDecode <T>
crear ( Ámbito de ámbito, Operando <String> input, String inputEncoding, Class<T> Tsplits, Opciones... opciones)
Método de fábrica para crear una clase que envuelve una nueva operación UnicodeDecode.
UnicodeDecode estático <Largo>
crear ( ámbito de ámbito, entrada de operando <String>, codificación de entrada de cadena, opciones... opciones)
Método de fábrica para crear una clase que envuelve una nueva operación UnicodeDecode usando tipos de salida predeterminados.
UnicodeDecode.Opciones estáticas
errores (errores de cadena)
UnicodeDecode.Opciones estáticas
replaceControlCharacters (Booleano replaceControlCharacters)
UnicodeDecode.Opciones estáticas
replaceChar (Carácter de reemplazo largo)
Salida <T>
divisiones por filas ()
Un tensor 1D int32 que contiene las divisiones de fila.

Métodos Heredados

Métodos públicos

Salida pública <Entero> charValues ​​()

Un tensor 1D int32 que contiene los puntos de código decodificados.

public static UnicodeDecode <T> create ( Scope scope, Operand <String> input, String inputEncoding, Class<T> Tsplits, Options... options)

Método de fábrica para crear una clase que envuelve una nueva operación UnicodeDecode.

Parámetros
alcance alcance actual
aporte El texto a decodificar. Puede tener cualquier forma. Tenga en cuenta que la salida se aplana a un vector de valores de caracteres.
codificación de entrada Codificación de texto de las cadenas de entrada. Esta es cualquiera de las codificaciones admitidas por los convertidores algorítmicos ICU ucnv. Ejemplos: `"UTF-16", "US ASCII", "UTF-8"`.
opciones lleva valores de atributos opcionales
Devoluciones
  • una nueva instancia de UnicodeDecode

public static UnicodeDecode <Long> create ( Scope scope, Operand <String> input, String inputEncoding, Options... options)

Método de fábrica para crear una clase que envuelve una nueva operación UnicodeDecode usando tipos de salida predeterminados.

Parámetros
alcance alcance actual
aporte El texto a decodificar. Puede tener cualquier forma. Tenga en cuenta que la salida se aplana a un vector de valores de caracteres.
codificación de entrada Codificación de texto de las cadenas de entrada. Esta es cualquiera de las codificaciones admitidas por los convertidores algorítmicos ICU ucnv. Ejemplos: `"UTF-16", "US ASCII", "UTF-8"`.
opciones lleva valores de atributos opcionales
Devoluciones
  • una nueva instancia de UnicodeDecode

Errores UnicodeDecode.Options estáticos públicos (errores de cadena)

Parámetros
errores Política de manejo de errores cuando se encuentra un formato no válido en la entrada. El valor de 'estricto' hará que la operación produzca un error de argumento no válido en cualquier formato de entrada no válido. Un valor de 'reemplazar' (el valor predeterminado) hará que la operación reemplace cualquier formato no válido en la entrada con el punto de código `replacement_char`. Un valor de 'ignorar' hará que la operación omita cualquier formato no válido en la entrada y no produzca ningún carácter de salida correspondiente.

public static UnicodeDecode.Options replaceControlCharacters (Boolean replaceControlCharacters)

Parámetros
reemplazar los caracteres de control Si reemplazar los caracteres de control C0 (00-1F) con `replacement_char`. El valor predeterminado es falso.

public static UnicodeDecode.Options replacementChar (Carácter de reemplazo largo)

Parámetros
reemplazoChar El punto de código del carácter de reemplazo que se usará en lugar de cualquier formato no válido en la entrada cuando `errors='replace'`. Se puede utilizar cualquier punto de código Unicode válido. El valor predeterminado es que el carácter de reemplazo Unicode predeterminado es 0xFFFD o U+65533).

Salida pública <T> divisiones de filas ()

Un tensor 1D int32 que contiene las divisiones de fila.

,
clase final pública UnicodeDecode

Decodifica cada cadena en `entrada` en una secuencia de puntos de código Unicode.

Los puntos de código de caracteres para todas las cadenas se devuelven utilizando un solo vector `char_values`, con cadenas expandidas a caracteres en orden de fila principal.

El tensor `row_splits` indica dónde comienzan y terminan los puntos de código para cada cadena de entrada dentro del tensor `char_values`. En particular, los valores para la `i`ésima cadena (en orden de fila principal) se almacenan en el segmento `[row_splits[i]:row_splits[i+1]]`. Por lo tanto:

  • `char_values[row_splits[i]+j]` es el punto de código Unicode para el `j`ésimo carácter en la `i`ésima cadena (en orden de fila principal).
  • `row_splits[i+1] - row_splits[i]` es el número de caracteres en la `i`ésima cadena (en orden de fila principal).

Clases anidadas

clase UnicodeDecode.Opciones Atributos opcionales para UnicodeDecode

Métodos públicos

Salida <Entero>
valoreschar ()
Un tensor 1D int32 que contiene los puntos de código decodificados.
estático <T extiende Número> UnicodeDecode <T>
crear ( Ámbito de ámbito, Operando <String> input, String inputEncoding, Class<T> Tsplits, Opciones... opciones)
Método de fábrica para crear una clase que envuelve una nueva operación UnicodeDecode.
UnicodeDecode estático <Largo>
crear ( ámbito de ámbito, entrada de operando <String>, codificación de entrada de cadena, opciones... opciones)
Método de fábrica para crear una clase que envuelve una nueva operación UnicodeDecode usando tipos de salida predeterminados.
UnicodeDecode.Opciones estáticas
errores (errores de cadena)
UnicodeDecode.Opciones estáticas
replaceControlCharacters (Booleano replaceControlCharacters)
UnicodeDecode.Opciones estáticas
replaceChar (Carácter de reemplazo largo)
Salida <T>
divisiones por filas ()
Un tensor 1D int32 que contiene las divisiones de fila.

Métodos Heredados

Métodos públicos

Salida pública <Entero> charValues ​​()

Un tensor 1D int32 que contiene los puntos de código decodificados.

public static UnicodeDecode <T> create ( Scope scope, Operand <String> input, String inputEncoding, Class<T> Tsplits, Options... options)

Método de fábrica para crear una clase que envuelve una nueva operación UnicodeDecode.

Parámetros
alcance alcance actual
aporte El texto a decodificar. Puede tener cualquier forma. Tenga en cuenta que la salida se aplana a un vector de valores de caracteres.
codificación de entrada Codificación de texto de las cadenas de entrada. Esta es cualquiera de las codificaciones admitidas por los convertidores algorítmicos ICU ucnv. Ejemplos: `"UTF-16", "US ASCII", "UTF-8"`.
opciones lleva valores de atributos opcionales
Devoluciones
  • una nueva instancia de UnicodeDecode

public static UnicodeDecode <Long> create ( Scope scope, Operand <String> input, String inputEncoding, Options... options)

Método de fábrica para crear una clase que envuelve una nueva operación UnicodeDecode usando tipos de salida predeterminados.

Parámetros
alcance alcance actual
aporte El texto a decodificar. Puede tener cualquier forma. Tenga en cuenta que la salida se aplana a un vector de valores de caracteres.
codificación de entrada Codificación de texto de las cadenas de entrada. Esta es cualquiera de las codificaciones admitidas por los convertidores algorítmicos ICU ucnv. Ejemplos: `"UTF-16", "US ASCII", "UTF-8"`.
opciones lleva valores de atributos opcionales
Devoluciones
  • una nueva instancia de UnicodeDecode

Errores UnicodeDecode.Options estáticos públicos (errores de cadena)

Parámetros
errores Política de manejo de errores cuando se encuentra un formato no válido en la entrada. El valor de 'estricto' hará que la operación produzca un error de argumento no válido en cualquier formato de entrada no válido. Un valor de 'reemplazar' (el valor predeterminado) hará que la operación reemplace cualquier formato no válido en la entrada con el punto de código `replacement_char`. Un valor de 'ignorar' hará que la operación omita cualquier formato no válido en la entrada y no produzca ningún carácter de salida correspondiente.

public static UnicodeDecode.Options replaceControlCharacters (Boolean replaceControlCharacters)

Parámetros
reemplazar los caracteres de control Si reemplazar los caracteres de control C0 (00-1F) con `replacement_char`. El valor predeterminado es falso.

public static UnicodeDecode.Options replacementChar (Carácter de reemplazo largo)

Parámetros
reemplazoChar El punto de código del carácter de reemplazo que se usará en lugar de cualquier formato no válido en la entrada cuando `errors='replace'`. Se puede utilizar cualquier punto de código Unicode válido. El valor predeterminado es que el carácter de reemplazo Unicode predeterminado es 0xFFFD o U+65533).

Salida pública <T> divisiones de filas ()

Un tensor 1D int32 que contiene las divisiones de fila.