QuantizedMatMulWithBiasAndReluAndRequantize

clase final pública QuantizedMatMulWithBiasAndReluAndRequantize

Realice una multiplicación de matriz cuantizada de `a` por la matriz `b` con adición de sesgo y relu y recuantifique la fusión.

Las entradas deben ser matrices bidimensionales y vector de polarización 1D. Y la dimensión interior de `a` (después de transponerse si `transpose_a` es distinto de cero) debe coincidir con la dimensión exterior de `b` (después de transponerse si `transposed_b` es distinto de cero). Luego transmita la operación de suma con valores de sesgo en el resultado de la multiplicación de matrices. El tamaño del sesgo debe coincidir con la dimensión interna de `b`. Luego realice la activación de relu para obtener un resultado no negativo. Luego recuantifique la operación para obtener el resultado final de uint8.

Clases anidadas

clase QuantizedMatMulWithBiasAndReluAndRequantize.Options Atributos opcionales para QuantizedMatMulWithBiasAndReluAndRequantize

Métodos públicos

estático <W, T, U, V> QuantizedMatMulWithBiasAndReluAndRequantize <W>
create ( Ámbito ámbito, Operando <T> a, Operando <U> b, Operando <V> bias, Operando <Flotante> minA, Operando <Flotante> maxA, Operando <Flotante> minB, Operando <Flotante> maxB, Operando <Flotante > minFreezedOutput, Operand <Float> maxFreezedOutput, Class<W> Toutput, Opciones... opciones)
Método de fábrica para crear una clase que envuelve una nueva operación QuantizedMatMulWithBiasAndReluAndRequantize.
static QuantizedMatMulWithBiasAndReluAndRequantize.Options
inputQuantMode (Cadena inputQuantMode)
Salida <Flotante>
maxOut ()
El valor flotante que representa el valor de salida cuantificado más alto.
Salida <Flotante>
salida min ()
El valor flotante que representa el valor de salida cuantificado más bajo.
Salida <W>
fuera ()
static QuantizedMatMulWithBiasAndReluAndRequantize.Options
transposeA (Booleano transposeA)
static QuantizedMatMulWithBiasAndReluAndRequantize.Options
transposeB (Booleano transposeB)

Métodos Heredados

Métodos públicos

public static QuantizedMatMulWithBiasAndReluAndRequantize <W> create ( Alcance alcance, Operando <T> a, Operando <U> b, Operando <V> bias, Operando <Flotante> minA, Operando <Flotante> maxA, Operando <Flotante> minB, Operando <Flotante > maxB, Operando <Flotante> minFreezedOutput, Operando <Flotante> maxFreezedOutput, Clase<W> Tsalida, Opciones... opciones)

Método de fábrica para crear una clase que envuelve una nueva operación QuantizedMatMulWithBiasAndReluAndRequantize.

Parámetros
alcance alcance actual
un Una matriz a multiplicar. Debe ser un tensor bidimensional de tipo `quint8`.
b Una matriz a multiplicar y debe ser un tensor bidimensional de tipo `qint8`.
parcialidad Un tensor de polarización 1D cuyo tamaño coincide con la dimensión interna de `b` (después de transponerse si `transposed_b` no es cero).
minA El valor flotante que representa el valor `a` cuantificado más bajo.
maxA El valor flotante que representa el valor `a` cuantificado más alto.
minB El valor flotante que representa el valor `b` cuantificado más bajo.
maxB El valor flotante que representa el valor `b` cuantificado más alto.
minFreezedOutput El valor flotante que es el valor de salida cuantificado más alto después de volver a cuantificar.
opciones lleva valores de atributos opcionales
Devoluciones
  • una nueva instancia de QuantizedMatMulWithBiasAndReluAndRequantize

public static QuantizedMatMulWithBiasAndReluAndRequantize.Options inputQuantMode (String inputQuantMode)

Parámetros
inputQuantMode Modo de cuantificación de datos de entrada. MIN_FIRST (predeterminado) o ESCALADO.

Salida pública <Flotante> maxOut ()

El valor flotante que representa el valor de salida cuantificado más alto.

Salida pública <Flotante> minOut ()

El valor flotante que representa el valor de salida cuantificado más bajo.

Salida pública <W> fuera ()

public static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeA (Boolean transposeA)

Parámetros
transponerA Si es verdadero, `a` se transpone antes de la multiplicación.

public static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeB (Boolean transposeB)

Parámetros
transponerB Si es verdadero, `b` se transpone antes de la multiplicación.