QuantizedMatMulWithBiasAndReluAndRequantize

публичный финальный класс QuantizedMatMulWithBiasAndReluAndRequantize

Выполните квантованное матричное умножение `a` на матрицу `b` с добавлением смещения и повторным квантованием и повторным квантованием слияния.

Входные данные должны быть двумерными матрицами и одномерным вектором смещения. А внутреннее измерение `a` (после транспонирования, если `transpose_a` не равно нулю) должно соответствовать внешнему измерению `b` (после транспонирования, если `transpose_b` не равно нулю). Затем выполните операцию широковещательного сложения со значениями смещения результата умножения матрицы. Размер смещения должен соответствовать внутреннему размеру b. Затем выполните активацию relu, чтобы получить неотрицательный результат. Затем выполните операцию повторного квантования, чтобы получить окончательный результат uint8.

Вложенные классы

сорт QuantizedMatMulWithBiasAndReluAndRequantize.Options Дополнительные атрибуты для QuantizedMatMulWithBiasAndReluAndRequantize

Константы

Нить OP_NAME Название этой операции, известное основному движку TensorFlow.

Публичные методы

static <W расширяет TType > QuantizedMatMulWithBiasAndReluAndRequantize <W>
create ( Область видимости , Операнд <? расширяет TType > a, Операнд <? расширяет TType > b, Операнд <? расширяет TType > смещения, Операнд < TFloat32 > minA, Операнд < TFloat32 > maxA, Операнд < TFloat32 > minB, Операнд < TFloat32 > maxB, Operand < TFloat32 > minFreezedOutput, Operand < TFloat32 > maxFreezedOutput, Class<W> Toutput, Options... options)
Фабричный метод для создания класса, обертывающего новую операцию QuantizedMatMulWithBiasAndReluAndRequantize.
статический QuantizedMatMulWithBiasAndReluAndRequantize.Options
inputQuantMode (строка inputQuantMode)
Вывод <TFloat32>
использовать полностью ()
Значение с плавающей запятой, которое представляет наибольшее квантованное выходное значение.
Вывод <TFloat32>
минаут ()
Значение с плавающей запятой, которое представляет наименьшее квантованное выходное значение.
Выход <Вт>
вне ()
статический QuantizedMatMulWithBiasAndReluAndRequantize.Options
transposeA (логическое значение transposeA)
статический QuantizedMatMulWithBiasAndReluAndRequantize.Options
transposeB (логическое значение transposeB)

Унаследованные методы

Константы

общедоступная статическая финальная строка OP_NAME

Название этой операции, известное основному движку TensorFlow.

Постоянное значение: «QuantizedMatMulWithBiasAndReluAndRequantize»

Публичные методы

public static QuantizedMatMulWithBiasAndReluAndRequantize <W> create ( Область действия, Операнд <? расширяет TType > a, Операнд <? расширяет TType > b, Операнд <? расширяет TType > смещения, Операнд < TFloat32 > minA, Операнд < TFloat32 > maxA, Операнд < TFloat32 > minB, Операнд < TFloat32 > maxB, Операнд < TFloat32 > minFreezedOutput, Операнд < TFloat32 > maxFreezedOutput, Class<W> Toutput, Опции... опции)

Фабричный метод для создания класса, обертывающего новую операцию QuantizedMatMulWithBiasAndReluAndRequantize.

Параметры
объем текущий объем
а Матрица, которую нужно умножить. Должен быть двумерным тензором типа «quint8».
б Матрица, подлежащая умножению, должна быть двумерным тензором типа qint8.
предвзятость Одномерный тензор смещения, размер которого соответствует внутреннему размеру `b` (после транспонирования, если `transpose_b` не равно нулю).
минА Значение с плавающей запятой, которое представляет наименьшее квантованное значение a.
МаксА Значение с плавающей запятой, которое представляет наибольшее квантованное значение `a`.
минБ Значение с плавающей запятой, которое представляет наименьшее квантованное значение `b`.
МаксБ Значение с плавающей запятой, которое представляет наибольшее квантованное значение `b`.
минфризедвыход Значение с плавающей запятой, которое является наибольшим квантованным выходным значением после повторного квантования.
параметры содержит значения необязательных атрибутов
Возврат
  • новый экземпляр QuantizedMatMulWithBiasAndReluAndRequantize

public static QuantizedMatMulWithBiasAndReluAndRequantize.Options inputQuantMode (String inputQuantMode)

Параметры
вводQuantMode Режим квантования входных данных. Либо MIN_FIRST (по умолчанию), либо SCALED.

публичный вывод <TFloat32> maxOut ()

Значение с плавающей запятой, которое представляет наибольшее квантованное выходное значение.

публичный вывод <TFloat32> minOut ()

Значение с плавающей запятой, которое представляет наименьшее квантованное выходное значение.

публичный вывод <W> out ()

public static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeA (Boolean transposeA)

Параметры
транспонироватьА Если это правда, `a` транспонируется перед умножением.

public static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeB (Boolean transposeB)

Параметры
транспонировать Б Если это правда, `b` транспонируется перед умножением.