CtcGreedyDecoder

classe finale publique CtcGreedyDecoder

Effectue un décodage gourmand sur les logits donnés en entrées.

Une note sur l'attribut merge_repeated : s'il est activé, lorsque les indices maximum des logits consécutifs sont les mêmes, seul le premier d'entre eux est émis. En étiquetant le blanc '*', la séquence "ABB * BB" devient "ABB" si merge_repeated = True et "ABBBB" si merge_repeated = False.

Quelle que soit la valeur de merge_repeated, si l'index maximum d'une heure et d'un lot donnés correspond au blanc, index `(num_classes - 1)`, aucun nouvel élément n'est émis.

Classes imbriquées

classe CtcGreedyDecoder.Options Attributs facultatifs pour CtcGreedyDecoder

Constantes

Chaîne OP_NAME Le nom de cette opération, tel que connu par le moteur principal TensorFlow

Méthodes publiques

statique <T étend TNumber > CtcGreedyDecoder <T>
créer (Portée de portée , Entrées Opérande <T>, Opérande < TInt32 > séquenceLongueur, Options... options)
Méthode d'usine pour créer une classe encapsulant une nouvelle opération CtcGreedyDecoder.
Sortie < TInt64 >
Indices décodés ()
Matrice d'indices, taille `(total_decoded_outputs x 2)`, d'un `SparseTensor `.
Sortie < TInt64 >
forme décodée ()
Vecteur de forme, taille `(2)`, du SparseTensor décodé.
Sortie < TInt64 >
valeurs décodées ()
Vecteur de valeurs, taille : `(total_decoded_outputs)`, d'un `SparseTensor `.
Sortie <T>
logProbabilité ()
Matrice, taille `(batch_size x 1)`, contenant les probabilités du journal de séquence.
statique CtcGreedyDecoder.Options
mergeRepeated (fusion booléenne répétée)

Méthodes héritées

Constantes

chaîne finale statique publique OP_NAME

Le nom de cette opération, tel que connu par le moteur principal TensorFlow

Valeur constante : "CTCGreedyDecoder"

Méthodes publiques

public static CtcGreedyDecoder <T> créer (portée de la portée , entrées de l' opérande <T>, opérande <TInt32> séquenceLength, options... options)

Méthode d'usine pour créer une classe encapsulant une nouvelle opération CtcGreedyDecoder.

Paramètres
portée portée actuelle
contributions 3-D, forme : `(max_time x batch_size x num_classes)`, les logits.
séquenceLongueur Un vecteur contenant des longueurs de séquence, taille `(batch_size)`.
choix porte des valeurs d'attributs facultatifs
Retour
  • une nouvelle instance de CtcGreedyDecoder

Sortie publique < TInt64 > decodedIndices ()

Matrice d'indices, taille `(total_decoded_outputs x 2)`, d'un `SparseTensor `. Les lignes stockent : [lot, heure].

Sortie publique < TInt64 > decodedShape ()

Vecteur de forme, taille `(2)`, du SparseTensor décodé. Les valeurs sont : `[batch_size, max_decoded_length]`.

Sortie publique < TInt64 > decodedValues ​​()

Vecteur de valeurs, taille : `(total_decoded_outputs)`, d'un `SparseTensor `. Le vecteur stocke les classes décodées.

sortie publique <T> logProbability ()

Matrice, taille `(batch_size x 1)`, contenant les probabilités du journal de séquence.

public statique CtcGreedyDecoder.Options mergeRepeated (booléen mergeRepeated)

Paramètres
fusionRépété Si True, fusionne les classes répétées dans la sortie.