UniformRequantize

clase final pública UniformRequantize

Dada la "entrada" del tensor cuantificado, recuantícelo con nuevos parámetros de cuantificación.

Dado el tensor cuantificado `input`, que se cuantizó usando {input_scales, input_zero_points, input_quantization_axis, input_quantization_min_val, input_quantization_max_val}, recuantícelo a un tensor, que se cuantifica usando {output_scales, output_zero_points, output_quantization_axis, output_quantization_min_val, output_quantization_max_val}. La recuantización se realiza utilizando la fórmula: datos_cuantificados de salida = clip( (datos_cuantificados de entrada - punto_cero_entrada) * (escala_entrada / escala_salida) + punto_cero_salida, valor_min_cuantificación_salida, valor_max_cuantización_salida)

Los casos compatibles con la cuantificación por tensor y por eje son los siguientes:

  • por tensor -> por tensor
  • por tensor -> por eje
  • por eje -> por eje donde input_quantization_axis es igual a output_quantization_axis. es decir, al menos uno entre input_quantization_axis y output_quantization_axis debe ser -1, o dos deben ser iguales.

Clases anidadas

clase Opciones de Recuantización uniforme Atributos opcionales para UniformRequantize

Métodos públicos

Salida <U>
como salida ()
Devuelve el identificador simbólico de un tensor.
estático <U, T> Recuantización uniforme <U>
crear (alcance de alcance , entrada de operando <T>, escalas de entrada de operando <entero> , escalas de salida de operando <entero>, escalas de salida de operando <entero>, salida de operando <entero> puntos cero, clase <U> total, valor mínimo de cuantificación de entrada larga, valor máximo de cuantificación de entrada larga, valor mínimo de cuantificación de salida larga, Salida largaQuantizationMaxVal, Opciones... opciones)
Método de fábrica para crear una clase que envuelve una nueva operación UniformRequantize.
UniformRequantize.Options estático
inputQuantizationAxis (eje de cuantificación de entrada largo)
Salida <U>
producción ()
La salida cuantizó el tensor de Tout, cuya forma es la misma que la entrada.
UniformRequantize.Options estático
OutputQuantizationAxis (eje de cuantificación de salida largo)

Métodos heredados

Métodos públicos

Salida pública <U> como Salida ()

Devuelve el identificador simbólico de un tensor.

Las entradas a las operaciones de TensorFlow son salidas de otra operación de TensorFlow. Este método se utiliza para obtener un identificador simbólico que representa el cálculo de la entrada.

public static UniformRequantize <U> create ( Alcance alcance, Operando <T> entrada, Operando <Float> inputScales, Operando <Integer> inputZeroPoints, Operando <Float> outputScales, Operando <Integer> salidaZeroPoints, Class<U> Tout, Long inputQuantizationMinVal, Entrada largaQuantizationMaxVal, salida largaQuantizationMinVal, salida largaQuantizationMaxVal, Opciones... opciones)

Método de fábrica para crear una clase que envuelve una nueva operación UniformRequantize.

Parámetros
alcance alcance actual
aporte Debe ser un tensor de estaño.
escalas de entrada Los valores flotantes utilizados como escalas al cuantificar los datos originales que representa la "entrada". Debe ser un tensor escalar si quantization_axis es -1 (cuantización por tensor); de lo contrario, un tensor 1D de tamaño (input.dim_size(quantization_axis),) (cuantización por eje).
entradaCeroPuntos Los valores int32 utilizados como punto_cero al cuantificar los datos originales que representa la "entrada". Misma condición de forma que las escalas.
escalas de salida Los valores flotantes que se utilizarán como nuevas escalas para cuantificar los datos originales que representa la "entrada". Debe ser un tensor escalar si quantization_axis es -1 (cuantización por tensor); de lo contrario, un tensor 1D de tamaño (input.dim_size(quantization_axis),) (cuantización por eje).
salidaCeroPuntos Los valores int32 que se utilizarán como nuevos puntos cero para cuantificar los datos originales que representa la "entrada". Misma condición de forma que las escalas.
Revendedor El tipo de tensor de salida. Un tf.DType de: tf.qint8, tf.qint32
entradaCuantizaciónMinVal El valor mínimo de cuantificación que se utilizó al cuantificar los datos originales que representa la "entrada". El propósito de este atributo es típicamente (pero no limitado a) indicar un rango estrecho, donde se establece en: `(Tin más bajo) + 1` si es un rango estrecho, y `(Tin más bajo)` en caso contrario. Por ejemplo, si Tin es qint8, se establece en -127 si se cuantifica en un rango estrecho o en -128 en caso contrario.
entradaCuantizaciónMaxVal El valor máximo de cuantificación que se utilizó al cuantificar los datos originales que representa la "entrada". El propósito de este atributo es típicamente (pero no limitado a) indicar un rango estrecho, donde se establece en: `(Tout max)` tanto para el rango estrecho como para el rango no estrecho. Por ejemplo, si Tin es qint8, se establece en 127.
salidaCuantizaciónMinVal El nuevo valor mínimo de cuantificación para cuantificar los datos originales que representa la "entrada".
salidaQuantizationMaxVal El nuevo valor máximo de cuantificación para cuantificar los datos originales que representa la "entrada".
opciones lleva valores de atributos opcionales
Devoluciones
  • una nueva instancia de UniformRequantize

UniformRequantize.Options estático público inputQuantizationAxis (Entrada largaQuantizationAxis)

Parámetros
entradaCuantizaciónEje El eje de cuantificación que se utilizó al cuantificar los datos originales que representa la "entrada". Indica el índice de dimensión del tensor donde se aplica la cuantificación por eje para los cortes a lo largo de esa dimensión. Si se establece en -1 (predeterminado), esto indica cuantización por tensor. De lo contrario, debe configurarse dentro del rango [0, input.dims()).

Salida pública <U> salida ()

La salida cuantizó el tensor de Tout, cuya forma es la misma que la entrada.

UniformRequantize.Options estático público salidaQuantizationAxis (salida largaQuantizationAxis)

Parámetros
salidaCuantizaciónEje El nuevo eje de cuantificación que se utilizará para cuantificar los datos originales que representa la "entrada".