QuantizedMatMulWithBias

QuantizedMatMulWithBias public final class

Realiza una multiplicación de matriz cuantificada de `a` por la matriz` b` con sesgo suma.

Las entradas deben ser matrices bidimensionales y vector de sesgo 1D. Y la dimensión interna de `a` (después de ser transpuesta si` transpose_a` no es cero) debe coincidir con la dimensión externa de `b` (después de ser transpuesta si` transposed_b` es diferente de cero). Luego, difunda la operación de suma con valores de sesgo en el resultado de la multiplicación de matrices. El tamaño del sesgo debe coincidir con la dimensión interna de "b".

Clases anidadas

clase QuantizedMatMulWithBias.Options Los atributos opcionales para QuantizedMatMulWithBias

Métodos públicos

estática <W, T, U, V> QuantizedMatMulWithBias <W>
crear ( Alcance alcance, operando <T> a, operando <U> b, operando <V> sesgo, operando <Float> Mina, operando <Float> MAXA, operando <Float> Minb, operando <Float> maxb, Clase <W > TOutput, opciones ... opciones)
Método de fábrica para crear una clase que envuelva una nueva operación QuantizedMatMulWithBias.
estáticas QuantizedMatMulWithBias.Options
inputQuantMode (String inputQuantMode)
Salida <Float>
MAXOUT ()
El valor flotante que representa el valor de salida cuantificado más alto.
Salida <Float>
MinOut ()
El valor flotante que representa el valor de salida cuantificado más bajo.
Salida <W>
fuera ()
estáticas QuantizedMatMulWithBias.Options
transposeA (Boolean transposeA)
estáticas QuantizedMatMulWithBias.Options
transposeB (Boolean transposeB)

Métodos heredados

Métodos públicos

public static QuantizedMatMulWithBias <W> Crear ( Alcance alcance, operando <T> a, operando <U> b, operando <V> sesgo, operando <Float> Mina, operando <Float> MAXA, operando <Float> Minb, operando <Float > maxb, Clase <W> TOutput, opciones ... opciones)

Método de fábrica para crear una clase que envuelva una nueva operación QuantizedMatMulWithBias.

Parámetros
alcance alcance actual
a Una matriz para multiplicar. Debe ser un tensor bidimensional de tipo `quint8`.
B Una matriz a multiplicar y debe ser un tensor bidimensional de tipo `qint8`.
parcialidad Un tensor de sesgo 1D con tamaño que coincide con la dimensión interna de `b` (después de ser transpuesto si` transposed_b` es distinto de cero).
minA El valor flotante que representa el valor "a" cuantificado más bajo.
maxA El valor flotante que representa el valor "a" cuantificado más alto.
minB El valor flotante que representa el valor "b" cuantificado más bajo.
maxB El valor flotante que representa el valor "b" cuantificado más alto.
opciones lleva valores de atributos opcionales
Devoluciones
  • una nueva instancia de QuantizedMatMulWithBias

public static QuantizedMatMulWithBias.Options inputQuantMode (String inputQuantMode)

Parámetros
inputQuantMode Modo de cuantificación de datos de entrada. MIN_FIRST (predeterminado) o SCALED.

pública de salida <Float> MAXOUT ()

El valor flotante que representa el valor de salida cuantificado más alto.

pública de salida <Float> MinOut ()

El valor flotante que representa el valor de salida cuantificado más bajo.

pública de salida <W> cabo ()

public static QuantizedMatMulWithBias.Options transposeA (booleano transposeA)

Parámetros
transposeA Si es verdadero, se transpone `a` antes de la multiplicación.

public static QuantizedMatMulWithBias.Options transposeB (booleano transposeB)

Parámetros
transposeB Si es verdadero, se transpone `b` antes de la multiplicación.