SigmoidCrossEntropyWithLogits

パブリッククラスSigmoidCrossEntropyWithLogits

パブリックコンストラクター

SigmoidCrossEntropyWithLogits ()

パブリックメソッド

static <T extends TNumber >オペランド<T>

sigmoidCrossEntropyWithLogits (スコープスコープ、オペランド<T> ラベル、オペランド<T> ロジット)

logitsを指定してシグモイドクロスエントロピーを計算します。

継承されたメソッド

クラスjava.lang.Objectから

ブール値	等しい(オブジェクト arg0)
最終クラス<?>	getクラス()
整数	ハッシュコード（）
最後の空白	通知する()
最後の空白	すべて通知()
弦	toString ()
最後の空白	wait (long arg0, int arg1)
最後の空白	待機(長い引数0)
最後の空白	待って（）

パブリックコンストラクター

public SigmoidCrossEntropyWithLogits ()

パブリックメソッド

public static Operand <T> sigmoidCrossEntropyWithLogits (スコープスコープ、オペランド<T>ラベル、オペランド<T>ロジット)

logitsを指定してシグモイドクロスエントロピーを計算します。

各クラスが独立しており、相互排他的ではない離散分類タスクの確率誤差を測定します。たとえば、写真に象と犬の両方が同時に含まれる可能性がある場合、マルチラベル分類を実行できます。

簡潔にするために、 x = logits 、 z = labelsします。擬似コードのロジスティック損失は

 z * -log(sigmoid(x)) + (1 - z) * -log(1 - sigmoid(x))
  = z * -log(1 / (1 + exp(-x))) + (1 - z) * -log(exp(-x) / (1 + exp(-x)))
  = z * log(1 + exp(-x)) + (1 - z) * (-log(exp(-x)) + log(1 + exp(-x)))
  = z * log(1 + exp(-x)) + (1 - z) * (x + log(1 + exp(-x))
  = (1 - z) * x + log(1 + exp(-x))
  = x - x * z + log(1 + exp(-x))

です

x < 0の場合、 exp(-x)でのオーバーフローを避けるために、上記の

 x - x * z + log(1 + exp(-x))
  = log(exp(x)) - x * z + log(1 + exp(-x))
  = - x * z + log(1 + exp(x))

を再定式化します。

したがって、安定性を確保し、オーバーフローを回避するために、実装ではこの等価な定式化

   max(x, 0) - x * z + log(1 + exp(-abs(x)))

を使用します。

ロジットとlabels同じタイプと形状でなければなりません。

パラメーター

範囲	TensorFlow スコープ
ラベル	ラベル
ロジット	float32 または float64 型のロジット

戻り値

コンポーネントごとの物流損失。

投げる

IllegalArgumentException	ロジットとラベルが同じ形状でない場合