Выполните квантованное матричное умножение «a» на матрицу «b» с добавлением смещения и повторным слиянием.
Входные данные должны быть двумерными матрицами и одномерным вектором смещения. А внутреннее измерение `a` (после транспонирования, если `transpose_a` не равно нулю) должно соответствовать внешнему измерению `b` (после транспонирования, если `transpose_b` не равно нулю). Затем выполните операцию широковещательного сложения со значениями смещения результата умножения матрицы. Размер смещения должен соответствовать внутреннему размеру b. Затем выполните активацию relu, чтобы получить неотрицательный результат.
Вложенные классы
| сорт | QuantizedMatMulWithBiasAndRelu.Options | Дополнительные атрибуты для QuantizedMatMulWithBiasAndRelu | |
Публичные методы
| static <V, T, U> QuantizedMatMulWithBiasAndRelu <V> | create ( Область действия, Операнд <T> a, Операнд <U> b, Операнд <Float> смещение, Операнд <Float> minA, Операнд <Float> maxA, Операнд <Float> minB, Операнд <Float> maxB, Класс<V > Вывод, Опции... опции) Фабричный метод для создания класса, обертывающего новую операцию QuantizedMatMulWithBiasAndRelu. |
| статический QuantizedMatMulWithBiasAndRelu.Options | inputQuantMode (строка inputQuantMode) |
| Выход <С плавающей запятой> | использовать полностью () Значение с плавающей запятой, которое представляет наибольшее квантованное выходное значение. |
| Выход <С плавающей запятой> | минаут () Значение с плавающей запятой, которое представляет наименьшее квантованное выходное значение. |
| Выход <В> | вне () |
| статический QuantizedMatMulWithBiasAndRelu.Options | transposeA (логическое значение transposeA) |
| статический QuantizedMatMulWithBiasAndRelu.Options | transposeB (логическое значение transposeB) |
Унаследованные методы
Публичные методы
public static QuantizedMatMulWithBiasAndRelu <V> create ( Область действия, Операнд <T> a, Операнд <U> b, Операнд <Float> смещение, Операнд <Float> minA, Операнд <Float> maxA, Операнд <Float> minB, Операнд <Float > maxB, Class<V> Toutput, Options... options)
Фабричный метод для создания класса, обертывающего новую операцию QuantizedMatMulWithBiasAndRelu.
Параметры
| объем | текущий объем |
|---|---|
| а | Матрица, которую нужно умножить. Должен быть двумерным тензором типа «quint8». |
| б | Матрица, подлежащая умножению, должна быть двумерным тензором типа qint8. |
| предвзятость | Одномерный тензор смещения, размер которого соответствует внутреннему размеру `b` (после транспонирования, если `transpose_b` не равно нулю). |
| минА | Значение с плавающей запятой, которое представляет наименьшее квантованное значение a. |
| МаксА | Значение с плавающей запятой, которое представляет наибольшее квантованное значение `a`. |
| минБ | Значение с плавающей запятой, которое представляет наименьшее квантованное значение `b`. |
| МаксБ | Значение с плавающей запятой, которое представляет наибольшее квантованное значение `b`. |
| параметры | содержит значения необязательных атрибутов |
Возврат
- новый экземпляр QuantizedMatMulWithBiasAndRelu
общедоступный статический QuantizedMatMulWithBiasAndRelu.Options inputQuantMode (String inputQuantMode)
Параметры
| вводQuantMode | Режим квантования входных данных. Либо MIN_FIRST (по умолчанию), либо SCALED. |
|---|
публичный вывод <Float> maxOut ()
Значение с плавающей запятой, которое представляет наибольшее квантованное выходное значение.
публичный вывод <Float> minOut ()
Значение с плавающей запятой, которое представляет наименьшее квантованное выходное значение.
public static QuantizedMatMulWithBiasAndRelu.Options transposeA (Boolean transposeA)
Параметры
| транспонироватьА | Если это правда, `a` транспонируется перед умножением. |
|---|
public static QuantizedMatMulWithBiasAndRelu.Options transposeB (Boolean transposeB)
Параметры
| транспонировать Б | Если это правда, `b` транспонируется перед умножением. |
|---|