Wykonaj skwantowane mnożenie macierzy „a” przez macierz „b” z dodatkiem obciążenia i fuzją relu.
Dane wejściowe muszą być macierzami dwuwymiarowymi i wektorem odchylenia 1D. A wewnętrzny wymiar `a` (po transpozycji, jeśli `transpose_a` jest niezerowe) musi odpowiadać zewnętrznemu wymiarowi `b` (po transpozycji, jeśli `transpose_b` jest niezerowe). Następnie wykonaj operację dodawania transmisji z wartościami odchylenia na wyniku mnożenia macierzy. Rozmiar odchylenia musi odpowiadać wewnętrznemu wymiarowi „b”. Następnie wykonaj aktywację relu, aby uzyskać wynik nieujemny.
Klasy zagnieżdżone
klasa | QuantizedMatMulWithBiasAndRelu.Options | Opcjonalne atrybuty dla QuantizedMatMulWithBiasAndRelu |
Metody publiczne
statyczny <V, T, U> QuantizedMatMulWithBiasAndRelu <V> | utwórz ( Zakres zasięgu, Operand <T> a, Operand <U> b, Operand <Float> odchylenie, Operand <Float> minA, Operand <Float> maxA, Operand <Float> minB, Operand <Float> maxB, Class<V > Wyjście, Opcje... opcje) Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację QuantizedMatMulWithBiasAndRelu. |
statyczne QuantizedMatMulWithBiasAndRelu.Options | inputQuantMode (ciąg znaków inputQuantMode) |
Wyjście <Pływak> | maxOut () Wartość zmiennoprzecinkowa, którą reprezentuje najwyższa skwantowana wartość wyjściowa. |
Wyjście <Pływak> | MinOut () Wartość zmiennoprzecinkowa reprezentowana przez najniższą skwantyzowaną wartość wyjściową. |
Wyjście <V> | na zewnątrz () |
statyczne QuantizedMatMulWithBiasAndRelu.Options | transpozycjaA (logiczna transpozycjaA) |
statyczne QuantizedMatMulWithBiasAndRelu.Options | transpozycja B (logiczna transpozycja B) |
Metody dziedziczone
Metody publiczne
public static QuantizedMatMulWithBiasAndRelu <V> create ( Zakres zakresu, Operand <T> a, Operand <U> b, Operand <Float> odchylenie, Operand <Float> minA, Operand <Float> maxA, Operand <Float> minB, Operand <Float > maxB, Klasa<V> Towyjście, Opcje... opcje)
Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację QuantizedMatMulWithBiasAndRelu.
Parametry
zakres | aktualny zakres |
---|---|
A | Macierz do pomnożenia. Musi to być dwuwymiarowy tensor typu „quint8”. |
B | Macierz do pomnożenia, która musi być dwuwymiarowym tensorem typu `qint8`. |
stronniczość | Tensor odchylenia 1D z dopasowaniem rozmiaru do wewnętrznego wymiaru „b” (po transpozycji, jeśli „transponowany_b” jest niezerowy). |
minA | Wartość zmiennoprzecinkowa, którą reprezentuje najniższa skwantowana wartość „a”. |
maksA | Wartość zmiennoprzecinkowa, którą reprezentuje najwyższa skwantowana wartość „a”. |
minB | Wartość zmiennoprzecinkowa reprezentowana przez najniższą skwantowaną wartość „b”. |
maks. B | Wartość zmiennoprzecinkowa, którą reprezentuje najwyższa skwantowana wartość „b”. |
opcje | przenosi opcjonalne wartości atrybutów |
Zwroty
- nowa instancja QuantizedMatMulWithBiasAndRelu
public static QuantizedMatMulWithBiasAndRelu.Options inputQuantMode (String inputQuantMode)
Parametry
tryb wejściowyQuant | Tryb kwantyzacji danych wejściowych. Albo MIN_FIRST (domyślnie) albo SCALED. |
---|
publiczne wyjście <Float> maxOut ()
Wartość zmiennoprzecinkowa, którą reprezentuje najwyższa skwantowana wartość wyjściowa.
publiczne wyjście <Float> minOut ()
Wartość zmiennoprzecinkowa reprezentowana przez najniższą skwantyzowaną wartość wyjściową.
public static QuantizedMatMulWithBiasAndRelu.Options transposeA (Boolean transposeA)
Parametry
transponowaćA | Jeśli to prawda, „a” jest transponowane przed mnożeniem. |
---|
public static QuantizedMatMulWithBiasAndRelu.Options transposeB (Boolean transposeB)
Parametry
transponowaćB | Jeśli prawda, „b” jest transponowane przed mnożeniem. |
---|