CTCLossV2

aula final pública CTCLossV2

Calcula a Perda CTC (probabilidade de log) para cada entrada de lote. Também calcula

o gradiente. Esta classe executa a operação softmax para você, então as entradas devem ser, por exemplo, projeções lineares de saídas por um LSTM.

Classes aninhadas

aula CTCLossV2.Opções Atributos opcionais para CTCLossV2

Métodos públicos

estático CTCLossV2
create ( Escopo do escopo, entradas de Operando <Float>, Operando <Long> labelsIndices, Operando <Integer> labelsValues, Operando <Integer> sequenceLength, Options... options)
Método de fábrica para criar uma classe envolvendo uma nova operação CTCLossV2.
estático CTCLossV2.Options
ctcMergeRepeated (Booleano ctcMergeRepeated)
Saída <Float>
gradiente ()
O gradiente de 'perda'.
estático CTCLossV2.Options
ignoreLongerOutputsThanInputs (booleano ignoreLongerOutputsThanInputs)
Saída <Float>
perda ()
Um vetor (lote) contendo probabilidades logarítmicas.
estático CTCLossV2.Options
preprocessCollapseRepeated (booleano preprocessCollapseRepeated)

Métodos Herdados

Métodos públicos

public static CTCLossV2 create ( Escopo do escopo, entradas do Operando <Float>, Operando <Long> labelsIndices, Operando <Integer> labelsValues, Operando <Integer> sequenceLength, Options... options)

Método de fábrica para criar uma classe envolvendo uma nova operação CTCLossV2.

Parâmetros
alcance escopo atual
entradas 3-D, forma: `(max_time x batch_size x num_classes)`, os logits. O rótulo em branco padrão é 0 em vez de num_classes - 1.
labelsIndices Os índices de um `SparseTensor `. `labels_indices(i, :) == [b, t]` significa que `labels_values(i)` armazena o id para `(lote b, tempo t)`.
labelsValues Os valores (rótulos) associados ao lote e hora fornecidos.
sequênciaComprimento Um vetor contendo comprimentos de sequência (lote).
opções carrega valores de atributos opcionais
Devoluções
  • uma nova instância de CTCLossV2

public static CTCLossV2.Options ctcMergeRepeated (Boolean ctcMergeRepeated)

Parâmetros
ctcMergeRepetido Escalar. Se definido como falso, durante o cálculo do CTC, os rótulos não em branco repetidos não serão mesclados e serão interpretados como rótulos individuais. Esta é uma versão simplificada do CTC.

gradiente de saída pública <Float> ()

O gradiente de 'perda'. 3-D, forma: `(max_time x batch_size x num_classes)`.

public static CTCLossV2.Options ignoreLongerOutputsThanInputs (booleano ignoreLongerOutputsThanInputs)

Parâmetros
ignoreLongerOutputsThanInputs Escalar. Se definido como verdadeiro, durante o cálculo do CTC, os itens que possuem sequências de saída mais longas do que as sequências de entrada são ignorados: eles não contribuem para o termo de perda e têm gradiente zero.

perda pública <Float> de saída ()

Um vetor (lote) contendo probabilidades logarítmicas.

public static CTCLossV2.Options preprocessCollapseRepeated (Boolean preprocessCollapseRepeated)

Parâmetros
preprocessCollapseRepetido Escalar, se verdadeiro, os rótulos repetidos são recolhidos antes do cálculo do CTC.