バイアスaddとreluを使用して、行列 `b`による` a`の量子化行列乗算を実行し、融合を再量子化します。
入力は、2次元行列と1Dバイアスベクトルである必要があります。また、 `a`の内側の次元(` transpose_a`がゼロ以外の場合に転置された後)は `b`の外側の次元(` transposed_b`がゼロ以外の場合に転置された後)と一致する必要があります。次に、行列の乗算結果にバイアス値を使用してブロードキャスト加算演算を実行します。バイアスサイズは `b`の内部寸法と一致する必要があります。次に、reluアクティベーションを実行して、非負の結果を取得します。次に、操作を再量子化して、最終的なuint8の結果を取得します。
ネストされたクラス
クラス | QuantizedMatMulWithBiasAndReluAndRequantize.Options | QuantizedMatMulWithBiasAndReluAndRequantize オプションの属性 |
パブリックメソッド
static <W、T、U、V> QuantizedMatMulWithBiasAndReluAndRequantize <W> | |
staticQuantizedMatMulWithBiasAndReluAndRequantize.Options | inputQuantMode (String inputQuantMode) |
出力<フロート> | maxOut () 量子化された最大の出力値が表す浮動小数点値。 |
出力<フロート> | minOut () 量子化された最小の出力値が表す浮動小数点値。 |
出力<W> | アウト() |
staticQuantizedMatMulWithBiasAndReluAndRequantize.Options | transposeA (ブール値transposeA) |
staticQuantizedMatMulWithBiasAndReluAndRequantize.Options | transposeB (ブール値transposeB) |
継承されたメソッド
パブリックメソッド
public static QuantizedMatMulWithBiasAndReluAndRequantize <W> create (スコープスコープ、オペランド<T> a、オペランド<U> b、オペランド<V>バイアス、オペランド<フロート> minA、オペランド<フロート> maxA、オペランド<フロート> minB、オペランド<フロート> maxB、 Operand <Float> minFreezedOutput、 Operand <Float> maxFreezedOutput、Class <W> Toutput、Options ...オプション)
新しいQuantizedMatMulWithBiasAndReluAndRequantize操作をラップするクラスを作成するファクトリメソッド。
パラメーター
範囲 | 現在のスコープ |
---|---|
A | 乗算する行列。タイプ `quint8`の2次元テンソルである必要があります。 |
b | 乗算される行列であり、タイプ `qint8`の2次元テンソルである必要があります。 |
バイアス | サイズが `b`の内部次元と一致する1Dバイアステンソル(` transposed_b`がゼロ以外の場合に転置された後)。 |
minA | 最小の量子化された `a`値が表すfloat値。 |
maxA | 量子化された最大の `a`値が表すfloat値。 |
minB | 最小の量子化された `b`値が表すfloat値。 |
maxB | 量子化された最大の `b`値が表すfloat値。 |
minFreezedOutput | 再量子化後の最大量子化出力値のfloat値。 |
オプション | オプションの属性値を運ぶ |
戻り値
- QuantizedMatMulWithBiasAndReluAndRequantizeの新しいインスタンス
public staticQuantizedMatMulWithBiasAndReluAndRequantize.Options inputQuantMode (String inputQuantMode)
パラメーター
inputQuantMode | 入力データ量子化モード。 MIN_FIRST(デフォルト)またはSCALEDのいずれか。 |
---|
public staticQuantizedMatMulWithBiasAndReluAndRequantize.Options transposeA (ブール値transposeA)
パラメーター
transposeA | trueの場合、 `a`は乗算の前に転置されます。 |
---|
public staticQuantizedMatMulWithBiasAndReluAndRequantize.Options transposeB (ブール値transposeB)
パラメーター
transposeB | trueの場合、 `b`は乗算の前に転置されます。 |
---|