CTCLossV2

パブリック最終クラスCTCLossV2

各バッチエントリの CTC 損失 (対数確率) を計算します。計算もします

グラデーション。このクラスはソフトマックス演算を実行するため、入力は、たとえば LSTM による出力の線形投影である必要があります。

ネストされたクラス

クラスCTCLossV2.オプションCTCLossV2のオプションの属性

パブリックメソッド

静的CTCLossV2
create (スコープscope、オペランド<Float>入力、オペランド<Long>labelIndices、オペランド<Integer>labelValues、オペランド<Integer>sequenceLength、 Options...オプション)
新しい CTCLossV2 操作をラップするクラスを作成するためのファクトリ メソッド。
静的CTCLossV2.オプション
ctcMergeRepeated (ブール値の ctcMergeRepeated)
出力<浮動小数点数>
グラデーション()
「喪失」の勾配。
静的CTCLossV2.オプション
ignoreLongerOutputsThanInputs (ブール値のignoreLongerOutputsThanInputs)
出力<浮動小数点数>
損失()
対数確率を含むベクトル (バッチ)。
静的CTCLossV2.オプション
preprocessCollapseRepeated (ブール型 preprocessCollapseRepeated)

継承されたメソッド

パブリックメソッド

public static CTCLossV2 create (スコープscope、オペランド<Float>入力、オペランド<Long>labelIndices、オペランド<Integer>labelValues、オペランド<Integer>sequenceLength、 Options...オプション)

新しい CTCLossV2 操作をラップするクラスを作成するためのファクトリ メソッド。

パラメーター
範囲現在のスコープ
入力3-D、形状: `(max_time x batch_size x num_classes)`、ロジット。デフォルトの空白ラベルは num_classes - 1 ではなく 0 です。
ラベルインデックス`SparseTensor のインデックス`。 `labels_indices(i, :) == [b, t]` は、`labels_values(i)` が `(batch b, time t)` の ID を格納することを意味します。
ラベル値指定されたバッチと時間に関連付けられた値 (ラベル)。
シーケンスの長さシーケンスの長さを含むベクトル (バッチ)。
オプションオプションの属性値を持ちます
戻り値
  • CTCLossV2 の新しいインスタンス

public static CTCLossV2.Options ctcMergeRepeated (ブール値 ctcMergeRepeated)

パラメーター
ctcMergeRepeatedスカラー。 false に設定すると、CTC 計算中に、繰り返される空白以外のラベルはマージされず、個別のラベルとして解釈されます。これは CTC の簡易版です。

public出力<Float> gradient ()

「喪失」の勾配。 3-D、形状: `(max_time x batch_size x num_classes)`。

public static CTCLossV2.OptionsignoreLongerOutputsThanInputs (ブール値のignoreLongerOutputsThanInputs)

パラメーター
入力よりも長い出力を無視するスカラー。 true に設定すると、CTC 計算中に、入力シーケンスよりも長い出力シーケンスを持つ項目がスキップされます。これらの項目は損失項に寄与せず、勾配がゼロになります。

public出力<Float> loss ()

対数確率を含むベクトル (バッチ)。

public static CTCLossV2.Options preprocessCollapseRepeated (ブール型 preprocessCollapseRepeated)

パラメーター
前処理折りたたみ繰り返しスカラー。true の場合、CTC 計算の前に繰り返されるラベルが折りたたまれます。