パブリックファイナルクラスQuantizedMatMulWithBias
バイアス加算を使用して、行列 `b`による` a`の量子化された行列乗算を実行します。
入力は、2次元行列と1Dバイアスベクトルである必要があります。また、 `a`の内部次元(` transpose_a`がゼロ以外の場合に転置された後)は `b`の外部次元(` transposed_b`がゼロ以外の場合に転置された後)と一致する必要があります。次に、行列の乗算結果にバイアス値を使用してブロードキャスト加算演算を実行します。バイアスサイズは `b`の内部寸法と一致する必要があります。
ネストされたクラス
クラス | QuantizedMatMulWithBias.Options | QuantizedMatMulWithBias オプションの属性 |
パブリックメソッド
static <W、T、U、V> QuantizedMatMulWithBias <W> | |
静的QuantizedMatMulWithBias.Options | inputQuantMode (String inputQuantMode) |
出力<フロート> | maxOut () 量子化された最大の出力値が表す浮動小数点値。 |
出力<フロート> | minOut () 量子化された最小の出力値が表す浮動小数点値。 |
出力<W> | アウト() |
静的QuantizedMatMulWithBias.Options | transposeA (ブール値transposeA) |
静的QuantizedMatMulWithBias.Options | transposeB (ブール値transposeB) |
継承されたメソッド
パブリックメソッド
public static QuantizedMatMulWithBias <W> create (スコープスコープ、 Operand <T> a、 Operand <U> b、 Operand <V>バイアス、 Operand <Float> minA、 Operand <Float> maxA、 Operand <Float> minB、 Operand <Float > maxB、Class <W> Toutput、 Options ...オプション)
新しいQuantizedMatMulWithBias操作をラップするクラスを作成するファクトリメソッド。
パラメーター
範囲 | 現在のスコープ |
---|---|
A | 乗算する行列。タイプ `quint8`の2次元テンソルである必要があります。 |
b | 乗算される行列であり、タイプ `qint8`の2次元テンソルである必要があります。 |
バイアス | サイズが `b`の内部寸法に一致する1Dバイアステンソル(` transposed_b`がゼロ以外の場合に転置された後)。 |
minA | 最小の量子化された `a`値が表すfloat値。 |
maxA | 量子化された最大の `a`値が表すfloat値。 |
minB | 最小の量子化された `b`値が表すfloat値。 |
maxB | 量子化された最大の `b`値が表すfloat値。 |
オプション | オプションの属性値を運ぶ |
戻り値
- QuantizedMatMulWithBiasの新しいインスタンス
public static QuantizedMatMulWithBias.Options inputQuantMode (String inputQuantMode)
パラメーター
inputQuantMode | 入力データ量子化モード。 MIN_FIRST(デフォルト)またはSCALEDのいずれか。 |
---|
public static QuantizedMatMulWithBias.Options transposeA (ブール値transposeA)
パラメーター
transposeA | trueの場合、 `a`は乗算の前に転置されます。 |
---|
public static QuantizedMatMulWithBias.Options transposeB (ブール値transposeB)
パラメーター
transposeB | trueの場合、 `b`は乗算の前に転置されます。 |
---|