CTCLossV2

clase final pública CTCLossV2

Calcula la pérdida de CTC (probabilidad de registro) para cada entrada de lote. también calcula

el gradiente Esta clase realiza la operación softmax por usted, por lo que las entradas deben ser, por ejemplo, proyecciones lineales de salidas por un LSTM.

Clases anidadas

clase CTCLossV2.Opciones Atributos opcionales para CTCLossV2

Métodos públicos

CTCLossV2 estático
crear ( Ámbito ámbito, Operando <Flotante> entradas, Operando <Largo> etiquetasÍndices, Operando <Entero> etiquetasValores, Operando <Entero> longitud de secuencia, Opciones... opciones)
Método de fábrica para crear una clase que envuelve una nueva operación CTCLossV2.
CTCLossV2.Opciones estáticas
ctcMergeRepeated (Booleano ctcMergeRepeated)
Salida <Flotante>
gradiente ()
El gradiente de `pérdida`.
CTCLossV2.Opciones estáticas
ignoreLongerOutputsThanInputs (booleano ignoreLongerOutputsThanInputs)
Salida <Flotante>
pérdida ()
Un vector (lote) que contiene log-probabilidades.
CTCLossV2.Opciones estáticas
preprocessCollapseRepeated (booleano preprocessCollapseRepeated)

Métodos Heredados

Métodos públicos

public static CTCLossV2 create ( ámbito de ámbito, entradas de operando <flotante>, índices de etiquetas de operando <largo>, valores de etiquetas de operando <entero>, longitud de secuencia de operando <entero>, opciones... opciones)

Método de fábrica para crear una clase que envuelve una nueva operación CTCLossV2.

Parámetros
alcance alcance actual
entradas 3-D, forma: `(max_time x batch_size x num_classes)`, los logits. La etiqueta en blanco predeterminada es 0 en lugar de num_classes - 1.
etiquetasÍndices Los índices de un `SparseTensor `. `labels_indices(i, :) == [b, t]` significa `labels_values(i)` almacena la identificación para `(lote b, tiempo t)`.
etiquetasValores Los valores (etiquetas) asociados con el lote y el tiempo dados.
longitud de secuencia Un vector que contiene longitudes de secuencia (lote).
opciones lleva valores de atributos opcionales
Devoluciones
  • una nueva instancia de CTCLossV2

público estático CTCLossV2.Options ctcMergeRepeated (Boolean ctcMergeRepeated)

Parámetros
ctcFusionarRepetido Escalar. Si se establece en falso, durante el cálculo de CTC, las etiquetas repetidas que no estén en blanco no se fusionarán y se interpretarán como etiquetas individuales. Esta es una versión simplificada de CTC.

Gradiente público de salida <flotante> ()

El gradiente de `pérdida`. 3-D, forma: `(max_time x batch_size x num_classes)`.

public static CTCLossV2.Options ignoreLongerOutputsThanInputs (booleano ignoreLongerOutputsThanInputs)

Parámetros
ignorarLas salidas más largas que las entradas Escalar. Si se establece en verdadero, durante el cálculo de CTC, los elementos que tienen secuencias de salida más largas que las secuencias de entrada se omiten: no contribuyen al término de pérdida y tienen gradiente cero.

Salida pública <Flotante> pérdida ()

Un vector (lote) que contiene log-probabilidades.

public static CTCLossV2.Options preprocessCollapseRepeated (PreprocessCollapseRepeated booleano)

Parámetros
preprocesoContraerRepetido Escalar, si es verdadero, las etiquetas repetidas se colapsan antes del cálculo de CTC.