QuantizedMatMulWithBias

classe final pública QuantizedMatMulWithBias

Executa uma multiplicação de matriz quantizada de `a` pela matriz `b` com adição de polarização.

As entradas devem ser matrizes bidimensionais e vetor de polarização 1D. E a dimensão interna de `a` (após ser transposta se `transpose_a` for diferente de zero) deve corresponder à dimensão externa de `b` (após ser transposta se `transpose_b` for diferente de zero). Em seguida, faça a operação de adição de transmissão com valores de polarização no resultado da multiplicação da matriz. O tamanho da polarização deve corresponder à dimensão interna de `b`.

Classes aninhadas

aula QuantizedMatMulWithBias.Options Atributos opcionais para QuantizedMatMulWithBias

Métodos Públicos

estático <W, T, U, V> QuantizedMatMulWithBias <W>
create ( Escopo do escopo , Operando <T> a, Operando <U> b, Operando <V> polarização, Operando <Float> minA, Operando <Float> maxA, Operando <Float> minB, Operando <Float> maxB, Classe<W > Saída, Opções... opções)
Método de fábrica para criar uma classe que envolve uma nova operação QuantizedMatMulWithBias.
QuantizedMatMulWithBias.Options estático
inputQuantMode (string inputQuantMode)
Saída <flutuante>
maxOut ()
O valor flutuante que o valor de saída quantizado mais alto representa.
Saída <flutuante>
minOut ()
O valor flutuante que o valor de saída quantizado mais baixo representa.
Saída <W>
fora ()
QuantizedMatMulWithBias.Options estático
transposeA (transposeA booleana)
QuantizedMatMulWithBias.Options estático
transposeB (booleano transposeB)

Métodos herdados

Métodos Públicos

public static QuantizedMatMulWithBias <W> create (Escopo escopo , Operando <T> a, Operando <U> b, Operando <V> polarização, Operando <Float> minA, Operando <Float> maxA, Operando <Float> minB, Operando <Float > maxB, Class<W> Toutput, Opções... opções)

Método de fábrica para criar uma classe que envolve uma nova operação QuantizedMatMulWithBias.

Parâmetros
escopo escopo atual
a Uma matriz a ser multiplicada. Deve ser um tensor bidimensional do tipo `quint8`.
b Uma matriz a ser multiplicada e deve ser um tensor bidimensional do tipo `qint8`.
viés Um tensor de polarização 1D com tamanho correspondente à dimensão interna de `b` (após ser transposto se `transposed_b` for diferente de zero).
minA O valor flutuante que o valor `a` quantizado mais baixo representa.
máxA O valor flutuante que o valor `a` quantizado mais alto representa.
minB O valor flutuante que o valor `b` quantizado mais baixo representa.
máxB O valor flutuante que o valor `b` quantizado mais alto representa.
opções carrega valores de atributos opcionais
Devoluções
  • uma nova instância de QuantizedMatMulWithBias

público estático QuantizedMatMulWithBias.Options inputQuantMode (String inputQuantMode)

Parâmetros
entradaQuantMode Modo de quantização de dados de entrada. MIN_FIRST(padrão) ou SCALED.

Saída pública <Float> maxOut ()

O valor flutuante que o valor de saída quantizado mais alto representa.

Saída pública <Float> minOut ()

O valor flutuante que o valor de saída quantizado mais baixo representa.

Saída pública <W> out ()

public static QuantizedMatMulWithBias.Options transposeA (Boolean transposeA)

Parâmetros
transporA Se for verdade, `a` é transposto antes da multiplicação.

public static QuantizedMatMulWithBias.Options transposeB (Boolean transposeB)

Parâmetros
transporB Se for verdade, `b` é transposto antes da multiplicação.