CtcBeamSearchDecoder

clase final pública CtcBeamSearchDecoder

Realiza decodificación de búsqueda de haz en los logits dados en la entrada.

Una nota sobre el atributo merge_repeated: Para el decodificador de búsqueda de haces, esto significa que si las entradas consecutivas en un haz son iguales, solo se emite la primera de ellas. Es decir, cuando la ruta superior es "ABBBB", se devuelve "AB" si merge_repeated = True pero se devuelve "ABBBB" si merge_repeated = False.

Clases anidadas

clase CtcBeamSearchDecoder.Opciones Atributos opcionales para CtcBeamSearchDecoder

Constantes

Cadena OP_NOMBRE El nombre de esta operación, como lo conoce el motor central de TensorFlow.

Métodos públicos

estático <T extiende TNumber > CtcBeamSearchDecoder <T>
crear (alcance alcance , entradas de operando <T>, operando <TInt32> longitud de secuencia, ancho de haz largo, rutas superiores largas, opciones... opciones)
Método de fábrica para crear una clase que envuelve una nueva operación CtcBeamSearchDecoder.
Lista< Salida < TInt64 >>
índices decodificados ()
Una lista (longitud: top_paths) de matrices de índices.
Lista< Salida < TInt64 >>
forma decodificada ()
Una lista (longitud: top_paths) de vectores de formas.
Lista< Salida < TInt64 >>
valores decodificados ()
Una lista (longitud: top_paths) de vectores de valores.
Salida <T>
logProbabilidad ()
Una matriz, con la forma: `(batch_size x top_paths)`.
CtcBeamSearchDecoder.Options estático
mergeRepeated (fusión booleana repetida)

Métodos heredados

Constantes

Cadena final estática pública OP_NAME

El nombre de esta operación, como lo conoce el motor central de TensorFlow.

Valor constante: "CTCBeamSearchDecoder"

Métodos públicos

creación pública estática de CtcBeamSearchDecoder <T> (alcance de alcance , entradas de operando <T>, longitud de secuencia de operando <TInt32> , ancho de haz largo, rutas superiores largas, opciones... opciones)

Método de fábrica para crear una clase que envuelve una nueva operación CtcBeamSearchDecoder.

Parámetros
alcance alcance actual
entradas 3-D, forma: `(tiempo_máximo x tamaño_de_lote x núm_clases)`, los logits.
secuenciaLongitud Un vector que contiene longitudes de secuencia, tamaño "(lote)".
amplitud de rayo Un escalar >= 0 (ancho del haz de búsqueda de haz).
rutas superiores Un escalar >= 0, <= beam_width (controla el tamaño de salida).
opciones lleva valores de atributos opcionales
Devoluciones
  • una nueva instancia de CtcBeamSearchDecoder

Lista pública < Salida < TInt64 >> índices decodificados ()

Una lista (longitud: top_paths) de matrices de índices. La matriz j, tamaño `(total_decoded_outputs[j] x 2)`, tiene índices de `SparseTensor `. Las filas almacenan: [lote, tiempo].

Lista pública < Salida < TInt64 >> decodedShape ()

Una lista (longitud: top_paths) de vectores de formas. El vector j, tamaño `(2)`, almacena la forma del `SparseTensor[j]` decodificado. Sus valores son: `[batch_size, max_decoded_length[j]]`.

Lista pública < Salida < TInt64 >> valores decodificados ()

Una lista (longitud: top_paths) de vectores de valores. El vector j, tamaño `(longitud total_decoded_outputs[j])`, tiene los valores de un `SparseTensor `. El vector almacena las clases decodificadas para el haz j.

Salida pública <T> logProbability ()

Una matriz, con la forma: `(batch_size x top_paths)`. La secuencia log-probabilidades.

CtcBeamSearchDecoder.Options estático público mergeRepeated (mergeRepeated booleano)

Parámetros
fusionarRepetido Si es verdadero, combine clases repetidas en la salida.