QuantizedMatMulWithBiasAndRelu

publiczna klasa końcowa QuantizedMatMulWithBiasAndRelu

Wykonaj skwantowane mnożenie macierzy „a” przez macierz „b” z dodatkiem obciążenia i fuzją relu.

Dane wejściowe muszą być macierzami dwuwymiarowymi i wektorem odchylenia 1D. A wewnętrzny wymiar `a` (po transpozycji, jeśli `transpose_a` jest niezerowe) musi odpowiadać zewnętrznemu wymiarowi `b` (po transpozycji, jeśli `transpose_b` jest niezerowe). Następnie wykonaj operację dodawania transmisji z wartościami odchylenia na wyniku mnożenia macierzy. Rozmiar odchylenia musi odpowiadać wewnętrznemu wymiarowi „b”. Następnie wykonaj aktywację relu, aby uzyskać wynik nieujemny.

Klasy zagnieżdżone

klasa QuantizedMatMulWithBiasAndRelu.Options Opcjonalne atrybuty dla QuantizedMatMulWithBiasAndRelu

Stałe

Strunowy OP_NAME Nazwa tej operacji znana silnikowi rdzenia TensorFlow

Metody publiczne

statyczny <V rozszerza TType > QuantizedMatMulWithBiasAndRelu <V>
utwórz ( Zakres zasięgu , Operand <? rozszerza TType > a, Operand <? rozszerza TType > b, Operand < TFloat32 > bias, Operand < TFloat32 > minA, Operand < TFloat32 > maxA, Operand < TFloat32 > minB, Operand < TFloat32 > maxB , Class<V> Toutput, Opcje... opcje)
Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację QuantizedMatMulWithBiasAndRelu.
statyczne QuantizedMatMulWithBiasAndRelu.Options
inputQuantMode (ciąg znaków inputQuantMode)
Dane wyjściowe <TFloat32>
maxOut ()
Wartość zmiennoprzecinkowa, którą reprezentuje najwyższa skwantowana wartość wyjściowa.
Dane wyjściowe <TFloat32>
MinOut ()
Wartość zmiennoprzecinkowa reprezentowana przez najniższą skwantyzowaną wartość wyjściową.
Wyjście <V>
statyczne QuantizedMatMulWithBiasAndRelu.Options
transpozycjaA (logiczna transpozycjaA)
statyczne QuantizedMatMulWithBiasAndRelu.Options
transpozycja B (logiczna transpozycja B)

Metody dziedziczone

Stałe

publiczny statyczny końcowy ciąg znaków OP_NAME

Nazwa tej operacji znana silnikowi rdzenia TensorFlow

Wartość stała: „QuantizedMatMulWithBiasAndRelu”

Metody publiczne

public static QuantizedMatMulWithBiasAndRelu <V> create ( Zakres zakresu, Operand <? rozszerza TType > a, Operand <? rozszerza TType > b, Operand < TFloat32 > bias, Operand < TFloat32 > minA, Operand < TFloat32 > maxA, Operand < TFloat32 > minB , Operand < TFloat32 > maxB, Class<V> Toutput, Opcje... opcje)

Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację QuantizedMatMulWithBiasAndRelu.

Parametry
zakres aktualny zakres
A Macierz do pomnożenia. Musi to być dwuwymiarowy tensor typu „quint8”.
B Macierz do pomnożenia, która musi być dwuwymiarowym tensorem typu `qint8`.
stronniczość Tensor odchylenia 1D z dopasowaniem rozmiaru do wewnętrznego wymiaru „b” (po transpozycji, jeśli „transponowany_b” jest niezerowy).
minA Wartość zmiennoprzecinkowa, którą reprezentuje najniższa skwantowana wartość „a”.
maksA Wartość zmiennoprzecinkowa, którą reprezentuje najwyższa skwantowana wartość „a”.
minB Wartość zmiennoprzecinkowa reprezentowana przez najniższą skwantowaną wartość „b”.
maks. B Wartość zmiennoprzecinkowa, którą reprezentuje najwyższa skwantowana wartość „b”.
opcje przenosi opcjonalne wartości atrybutów
Zwroty
  • nowa instancja QuantizedMatMulWithBiasAndRelu

public static QuantizedMatMulWithBiasAndRelu.Options inputQuantMode (String inputQuantMode)

Parametry
tryb wejściowyQuant Tryb kwantyzacji danych wejściowych. Albo MIN_FIRST (domyślnie) albo SCALED.

publiczne wyjście < TFloat32 > maxOut ()

Wartość zmiennoprzecinkowa, którą reprezentuje najwyższa skwantowana wartość wyjściowa.

publiczne wyjście < TFloat32 > minOut ()

Wartość zmiennoprzecinkowa reprezentowana przez najniższą skwantyzowaną wartość wyjściową.

publiczne wyjście <V> out ()

public static QuantizedMatMulWithBiasAndRelu.Options transposeA (Boolean transposeA)

Parametry
transponowaćA Jeśli to prawda, „a” jest transponowane przed mnożeniem.

public static QuantizedMatMulWithBiasAndRelu.Options transposeB (Boolean transposeB)

Parametry
transponowaćB Jeśli prawda, „b” jest transponowane przed mnożeniem.