QuantizedMatMulWithBiasAndReluAndRequantize

public final class QuantizedMatMulWithBiasAndReluAndRequantize

Realize uma multiplicação de matriz quantizada de `a` pela matriz` b` com adição de polarização e fusão de relu e requantização.

As entradas devem ser matrizes bidimensionais e vetor de polarização 1D. E a dimensão interna de `a` (após ser transposta se` transpose_a` for diferente de zero) deve corresponder à dimensão externa de `b` (após ser transposta se` transposed_b` for diferente de zero). Em seguida, execute a operação de adição de broadcast com valores de polarização no resultado da multiplicação da matriz. O tamanho da polarização deve corresponder à dimensão interna de `b`. Em seguida, faça a ativação relu para obter um resultado não negativo. Em seguida, execute a operação de requantização para obter o resultado uint8 final.

Classes aninhadas

aula QuantizedMatMulWithBiasAndReluAndRequantize.Options Atributos opcionais para QuantizedMatMulWithBiasAndReluAndRequantize

Métodos Públicos

static <W, T, U, V> QuantizedMatMulWithBiasAndReluAndRequantize <W>
criar ( Âmbito âmbito, Operando <T> um, Operando <L> b, Operando <V> viés, Operando <flutuador> mina, Operando <flutuador> maxa, Operando <flutuador> minB, Operando <flutuador> maxB, Operando <flutuador > minFreezedOutput, Operando <float> maxFreezedOutput, Class <W> TOutput, Options ... opções)
Método de fábrica para criar uma classe que envolve uma nova operação QuantizedMatMulWithBiasAndReluAndRequantize.
static QuantizedMatMulWithBiasAndReluAndRequantize.Options
inputQuantMode (String inputQuantMode)
Resultado <Float>
maxOut ()
O valor flutuante que o valor de saída quantizado mais alto representa.
Resultado <Float>
minOut ()
O valor flutuante que o menor valor de saída quantizado representa.
Saída <W>
fora ()
static QuantizedMatMulWithBiasAndReluAndRequantize.Options
transposeA (boolean transposeA)
static QuantizedMatMulWithBiasAndReluAndRequantize.Options
transposeB (boolean transposeB)

Métodos herdados

Métodos Públicos

public static QuantizedMatMulWithBiasAndReluAndRequantize <W> criar ( Escopo do escopo, Operando <T> a, Operando <U> b, Operando <V> viés, Operando <Float> minA, Operando <Float> maxA, Operando <Float> minB, Operando <Float > maxB, Operando <float> minFreezedOutput, Operando <float> maxFreezedOutput, Class <W> TOutput, Options ... opções)

Método de fábrica para criar uma classe que envolve uma nova operação QuantizedMatMulWithBiasAndReluAndRequantize.

Parâmetros
alcance escopo atual
uma Uma matriz a ser multiplicada. Deve ser um tensor bidimensional do tipo `quint8`.
b Uma matriz a ser multiplicada e deve ser um tensor bidimensional do tipo `qint8`.
tendência Um tensor de polarização 1D com correspondência de tamanho com dimensão interna de `b` (após ser transposto se` transposed_b` for diferente de zero).
minA O valor flutuante que o menor valor `a` quantizado representa.
maxA O valor flutuante que o valor `a` quantizado mais alto representa.
minB O valor flutuante que o menor valor quantizado de `b` representa.
maxB O valor flutuante que o valor `b` quantizado mais alto representa.
minFreezedOutput O valor flutuante que o valor de saída quantizado mais alto após a requantização.
opções carrega valores de atributos opcionais
Devoluções
  • uma nova instância de QuantizedMatMulWithBiasAndReluAndRequantize

public static QuantizedMatMulWithBiasAndReluAndRequantize.Options inputQuantMode (String inputQuantMode)

Parâmetros
inputQuantMode Modo de quantização de dados de entrada. MIN_FIRST (padrão) ou SCALED.

public Output <Float> maxOut ()

O valor flutuante que o valor de saída quantizado mais alto representa.

public Output <Float> minOut ()

O valor flutuante que o menor valor de saída quantizado representa.

Saída pública <W> out ()

public static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeA (Boolean transposeA)

Parâmetros
transporA Se verdadeiro, `a` é transposto antes da multiplicação.

public static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeB (Boolean transposeB)

Parâmetros
transporB Se verdadeiro, `b` é transposto antes da multiplicação.