CTCLossV2

classe final pública CTCLossV2

Calcula a perda de CTC (probabilidade de log) para cada entrada de lote. Também calcula

o gradiente. Esta classe realiza a operação softmax para você, então as entradas devem ser, por exemplo, projeções lineares de saídas por um LSTM.

Classes aninhadas

aula CTCLossV2.Options Atributos opcionais para CTCLossV2

Métodos Públicos

CTCLossV2 estático
criar ( Scope escopo, Operando <float> insumos, Operando <longo> labelsIndices, Operando <inteiro> labelsValues, Operando <Integer> sequenceLength, Options ... Opções)
Método de fábrica para criar uma classe envolvendo uma nova operação CTCLossV2.
CTCLossV2.Options estáticos
ctcMergeRepeated (booleano ctcMergeRepeated)
Resultado <Float>
gradiente ()
O gradiente de `perda`.
CTCLossV2.Options estáticos
ignoreLongerOutputsThanInputs (Boolean ignoreLongerOutputsThanInputs)
Resultado <Float>
perda ()
Um vetor (lote) contendo log-probabilidades.
CTCLossV2.Options estáticos
preprocessCollapseRepeated (Boolean preprocessCollapseRepeated)

Métodos herdados

Métodos Públicos

public static CTCLossV2 criar ( Scope escopo, Operando <float> entradas, Operando <longo> labelsIndices, Operando <Integer> labelsValues, Operando <Integer> sequenceLength, Options ... Opções)

Método de fábrica para criar uma classe envolvendo uma nova operação CTCLossV2.

Parâmetros
alcance escopo atual
entradas 3-D, forma: `(max_time x batch_size x num_classes)`, os logits. O rótulo em branco padrão é 0, em vez de num_classes - 1.
labelsIndices Os índices de um `SparseTensor `. `labels_indices (i, :) == [b, t]` significa `labels_values ​​(i)` armazena o id para `(lote b, tempo t)`.
labelsValues Os valores (rótulos) associados ao lote e hora fornecidos.
sequenceLength Um vetor contendo comprimentos de sequência (lote).
opções carrega valores de atributos opcionais
Devoluções
  • uma nova instância de CTCLossV2

public static CTCLossV2.Options ctcMergeRepeated (Boolean ctcMergeRepeated)

Parâmetros
ctcMergeRepeated Escalar. Se definido como falso, durante o cálculo do CTC, rótulos não vazios repetidos não serão mesclados e serão interpretados como rótulos individuais. Esta é uma versão simplificada do CTC.

Gradiente public Output <Float> ()

O gradiente de `perda`. 3-D, forma: `(max_time x batch_size x num_classes)`.

public static CTCLossV2.Options ignoreLongerOutputsThanInputs (Boolean ignoreLongerOutputsThanInputs)

Parâmetros
ignoreLongerOutputsThanInputs Escalar. Se definido como verdadeiro, durante o cálculo do CTC, os itens que têm sequências de saída mais longas do que as sequências de entrada são ignorados: eles não contribuem para o termo de perda e têm gradiente zero.

Public Output <Float> loss ()

Um vetor (lote) contendo probabilidades logarítmicas.

public static CTCLossV2.Options preprocessCollapseRepeated (Boolean preprocessCollapseRepeated)

Parâmetros
preprocessCollapseRepeated Escalar, se verdadeiro, então os rótulos repetidos são recolhidos antes do cálculo do CTC.