Realize uma multiplicação de matriz quantizada de `a` pela matriz` b` com adição de polarização e fusão de relu e requantização.
As entradas devem ser matrizes bidimensionais e vetor de polarização 1D. E a dimensão interna de `a` (após ser transposta se` transpose_a` for diferente de zero) deve corresponder à dimensão externa de `b` (após ser transposta se` transposed_b` for diferente de zero). Em seguida, faça a operação de adição de broadcast com valores de polarização no resultado da multiplicação da matriz. O tamanho da polarização deve corresponder à dimensão interna de `b`. Em seguida, faça a ativação relu para obter um resultado não negativo. Em seguida, execute a operação de requantização para obter o resultado uint8 final.
Classes aninhadas
| classe | QuantizedMatMulWithBiasAndReluAndRequantize.Options | Atributos opcionais para QuantizedMatMulWithBiasAndReluAndRequantize | |
Métodos Públicos
| estática <W, T, U, V> QuantizedMatMulWithBiasAndReluAndRequantize <W> | criar ( escopo escopo, Operando <T> um, Operando <L> b, Operando <V> viés, Operando <flutuador> mina, Operando <flutuador> maxa, Operando <flutuador> minB, Operando <flutuador> maxB, Operando <flutuador > minFreezedOutput, Operando <float> maxFreezedOutput, Class <W> TOutput, Options ... opções) Método de fábrica para criar uma classe que envolve uma nova operação QuantizedMatMulWithBiasAndReluAndRequantize. |
| estáticos QuantizedMatMulWithBiasAndReluAndRequantize.Options | inputQuantMode (String inputQuantMode) |
| Output <float> | MAXOUT () O valor flutuante que o valor de saída quantizado mais alto representa. |
| Output <float> | minOut () O valor flutuante que o menor valor de saída quantizado representa. |
| Output <W> | a () |
| estáticos QuantizedMatMulWithBiasAndReluAndRequantize.Options | transposeA (booleano transposeA) |
| estáticos QuantizedMatMulWithBiasAndReluAndRequantize.Options | transposeB (booleano transposeB) |
Métodos herdados
Métodos Públicos
public static QuantizedMatMulWithBiasAndReluAndRequantize <W> criar ( Âmbito âmbito, Operando <T> um, Operando <L> b, Operando <V> viés, Operando <flutuador> mina, Operando <flutuador> maxa, Operando <flutuador> minB, Operando <flutuador > maxB, Operando <float> minFreezedOutput, Operando <float> maxFreezedOutput, Class <W> TOutput, Options ... opções)
Método de fábrica para criar uma classe que envolve uma nova operação QuantizedMatMulWithBiasAndReluAndRequantize.
Parâmetros
| alcance | escopo atual |
|---|---|
| uma | Uma matriz a ser multiplicada. Deve ser um tensor bidimensional do tipo `quint8`. |
| b | Uma matriz a ser multiplicada e deve ser um tensor bidimensional do tipo `qint8`. |
| tendência | Um tensor de polarização 1D com correspondência de tamanho com dimensão interna de `b` (após ser transposto se` transposed_b` for diferente de zero). |
| minA | O valor flutuante que o menor valor `a` quantizado representa. |
| maxA | O valor flutuante que o valor `a` quantizado mais alto representa. |
| minB | O valor flutuante que o menor valor quantizado de `b` representa. |
| maxB | O valor flutuante que o valor `b` quantizado mais alto representa. |
| minFreezedOutput | O valor flutuante que o valor de saída quantizado mais alto após a requantização. |
| opções | carrega valores de atributos opcionais |
Devoluções
- uma nova instância de QuantizedMatMulWithBiasAndReluAndRequantize
public static QuantizedMatMulWithBiasAndReluAndRequantize.Options inputQuantMode (String inputQuantMode)
Parâmetros
| inputQuantMode | Modo de quantização de dados de entrada. MIN_FIRST (padrão) ou SCALED. |
|---|
pública Output <float> MAXOUT ()
O valor flutuante que o valor de saída quantizado mais alto representa.
pública Output <float> minOut ()
O valor flutuante que o menor valor de saída quantizado representa.
public static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeA (Boolean transposeA)
Parâmetros
| transporA | Se verdadeiro, `a` é transposto antes da multiplicação. |
|---|
public static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeB (Boolean transposeB)
Parâmetros
| transporB | Se verdadeiro, `b` é transposto antes da multiplicação. |
|---|