Realiza una multiplicación de matriz cuantificada de `a` por la matriz` b` con sesgo suma.
Las entradas deben ser matrices bidimensionales y vector de sesgo 1D. Y la dimensión interna de `a` (después de ser transpuesta si` transpose_a` no es cero) debe coincidir con la dimensión externa de `b` (después de ser transpuesta si` transposed_b` es diferente de cero). Luego difunda la operación de suma con valores de sesgo en el resultado de la multiplicación de matrices. El tamaño del sesgo debe coincidir con la dimensión interna de "b".
Clases anidadas
clase | QuantizedMatMulWithBias.Options | Atributos opcionales para QuantizedMatMulWithBias |
Métodos públicos
estático <W, T, U, V> QuantizedMatMulWithBias <W> | create ( alcance de alcance, operando <T> a, operando <U> b, sesgo de operando <V>, operando <Float> minA, operando <Float> maxA, operando <Float> minB, operando <Float> maxB, clase <W > Toutput, Opciones ... opciones) Método de fábrica para crear una clase que envuelva una nueva operación QuantizedMatMulWithBias. |
static QuantizedMatMulWithBias.Options | inputQuantMode (Cadena inputQuantMode) |
Salida <Float> | maxOut () El valor flotante que representa el valor de salida cuantificado más alto. |
Salida <Float> | minOut () El valor flotante que representa el valor de salida cuantificado más bajo. |
Salida <W> | fuera () |
static QuantizedMatMulWithBias.Options | transposeA ( transposeA booleana) |
static QuantizedMatMulWithBias.Options | transposeB ( transposeB booleano) |
Métodos heredados
Métodos públicos
public static QuantizedMatMulWithBias <W> Crear ( Alcance alcance, operando <T> a, operando <U> b, operando <V> sesgo, operando <Float> Mina, operando <Float> MAXA, operando <Float> Minb, operando <Float > maxB, Class <W> Toutput, Opciones ... opciones)
Método de fábrica para crear una clase que envuelva una nueva operación QuantizedMatMulWithBias.
Parámetros
alcance | alcance actual |
---|---|
a | Una matriz para multiplicar. Debe ser un tensor bidimensional de tipo `quint8`. |
B | Una matriz a multiplicar y debe ser un tensor bidimensional de tipo `qint8`. |
parcialidad | Un tensor de sesgo 1D con tamaño que coincide con la dimensión interna de `b` (después de ser transpuesto si` transposed_b` es distinto de cero). |
minA | El valor flotante que representa el valor "a" cuantificado más bajo. |
maxA | El valor flotante que representa el valor "a" cuantificado más alto. |
minB | El valor flotante que representa el valor "b" cuantificado más bajo. |
maxB | El valor flotante que representa el valor "b" cuantificado más alto. |
opciones | lleva valores de atributos opcionales |
Devoluciones
- una nueva instancia de QuantizedMatMulWithBias
public static QuantizedMatMulWithBias.Options inputQuantMode (String inputQuantMode)
Parámetros
inputQuantMode | Modo de cuantificación de datos de entrada. MIN_FIRST (predeterminado) o SCALED. |
---|
Salida pública <Float> maxOut ()
El valor flotante que representa el valor de salida cuantificado más alto.
Salida pública <Float> minOut ()
El valor flotante que representa el valor de salida cuantificado más bajo.
public static QuantizedMatMulWithBias.Options transposeA (Boolean transposeA)
Parámetros
transposeA | Si es verdadero, se transpone `a` antes de la multiplicación. |
---|
public static QuantizedMatMulWithBias.Options transposeB (Boolean transposeB)
Parámetros
transposeB | Si es verdadero, se transpone `b` antes de la multiplicación. |
---|