UnicodeEncode

classe finale publique UnicodeEncode

Encodez un tenseur d'entiers en chaînes Unicode.

Renvoie un vecteur de chaînes, où `output[i]` est construit en codant les points de code Unicode dans `input_values[input_splits[i]:input_splits[i+1]]` à l'aide de `output_encoding`.

---

Exemple :

input_values = [72, 101, 108, 108, 111, 87, 111, 114, 108, 100]
 input_splits = [0, 5, 10]
 output_encoding = 'UTF-8'
 
 output = ['Hello', 'World']
 

Classes imbriquées

classe UnicodeEncode.Options Attributs facultatifs pour UnicodeEncode

Méthodes publiques

Sortie <Chaîne>
comme Sortie ()
Renvoie le handle symbolique d'un tenseur.
statique <T étend le nombre> UnicodeEncode
créer ( Scope scope, Operand <Integer> inputValues, Operand <T> inputSplits, String outputEncoding, Options... options)
Méthode d'usine pour créer une classe encapsulant une nouvelle opération UnicodeEncode.
UnicodeEncode.Options statique
erreurs (erreurs de chaîne)
Sortie <Chaîne>
sortir ()
Le tenseur 1-D des chaînes codées à partir des points de code Unicode fournis.
UnicodeEncode.Options statique
remplacementChar (Long remplacementChar)

Méthodes héritées

Méthodes publiques

sortie publique <String> asOutput ()

Renvoie le handle symbolique d'un tenseur.

Les entrées des opérations TensorFlow sont les sorties d'une autre opération TensorFlow. Cette méthode est utilisée pour obtenir un handle symbolique qui représente le calcul de l’entrée.

public static UnicodeEncode créer ( Scope scope, Operand <Integer> inputValues, Operand <T> inputSplits, String outputEncoding, Options... options)

Méthode d'usine pour créer une classe encapsulant une nouvelle opération UnicodeEncode.

Paramètres
portée portée actuelle
valeurs d'entrée Un tenseur 1D contenant les points de code Unicode qui doivent être codés.
entréeSplits Un tenseur 1D spécifiant comment les points de code Unicode doivent être divisés en chaînes. En particulier, `output[i]` est construit en codant les points de code dans la tranche `input_values[input_splits[i]:input_splits[i+1]]`.
sortieEncodage Codage Unicode des chaînes de sortie. Les codages valides sont : `"UTF-8", "UTF-16-BE" et "UTF-32-BE"`.
choix porte des valeurs d'attributs facultatifs
Retour
  • une nouvelle instance d'UnicodeEncode

erreurs publiques statiques UnicodeEncode.Options (erreurs de chaîne)

Paramètres
les erreurs Politique de gestion des erreurs lorsqu’un formatage non valide est trouvé dans l’entrée. La valeur de « strict » entraînera la production d’une erreur InvalidArgument sur tout formatage d’entrée non valide. Une valeur de « replace » (la valeur par défaut) entraînera le remplacement par l'opération de tout formatage non valide dans l'entrée par le point de code « replacement_char ». Une valeur de « ignorer » entraînera l'opération à ignorer tout formatage non valide dans l'entrée et à ne produire aucun caractère de sortie correspondant.

sortie publique <String> sortie ()

Le tenseur 1-D des chaînes codées à partir des points de code Unicode fournis.

public statique UnicodeEncode.Options remplacementChar (Long remplacementChar)

Paramètres
remplacementChar Le point de code du caractère de remplacement à utiliser à la place de tout formatage non valide dans l'entrée lorsque `errors='replace'`. Tout point de code Unicode valide peut être utilisé. La valeur par défaut est que le caractère de remplacement Unicode par défaut est 0xFFFD (U+65533).