QuantizedMatMulWithBiasAndReluAndRequantize

공개 최종 클래스 QuantizedMatMulWithBiasAndReluAndReQuantize

바이어스 덧셈과 relu 및 재양자화 융합을 사용하여 행렬 'b'로 'a'의 양자화된 행렬 곱셈을 수행합니다.

입력은 2차원 행렬과 1D 바이어스 벡터여야 합니다. 그리고 `a`의 내부 차원(`transpose_a`가 0이 아닌 경우 전치된 후)은 `b`의 외부 차원(`transposed_b`가 0이 아닌 경우 전치된 후)과 일치해야 합니다. 그런 다음 행렬 곱셈 결과에 대한 바이어스 값을 사용하여 브로드캐스트 추가 작업을 수행합니다. 바이어스 크기는 'b'의 내부 차원과 일치해야 합니다. 그런 다음 relu 활성화를 수행하여 음수가 아닌 결과를 얻으십시오. 그런 다음 재양자화 작업을 수행하여 최종 uint8 결과를 얻습니다.

중첩 클래스

수업 QuantizedMatMulWithBiasAndReluAndReQuantize.Options QuantizedMatMulWithBiasAndReluAndRequantize 에 대한 선택적 속성

공개 방법

static <W, T, U, V> QuantizedMatMulWithBiasAndReluAndReQuantize <W>
create ( Scope 범위, Operand <T> a, Operand <U> b, Operand <V>bias, Operand <Float> minA, Operand <Float> maxA, Operand <Float> minB, Operand <Float> maxB, Operand <Float > minFreezedOutput, 피연산자 <Float> maxFreezedOutput, Class<W> Toutput, 옵션... 옵션)
새로운 QuantizedMatMulWithBiasAndReluAndReQuantize 작업을 래핑하는 클래스를 생성하는 팩토리 메서드입니다.
정적 QuantizedMatMulWithBiasAndReluAndReQuantize.Options
inputQuantMode (문자열 inputQuantMode)
출력 <플로트>
한계에 달하다 ()
가장 높은 양자화된 출력 값이 나타내는 부동 소수점 값입니다.
출력 <플로트>
최소 출력 ()
가장 낮은 양자화된 출력 값이 나타내는 부동 소수점 값입니다.
출력 <W>
정적 QuantizedMatMulWithBiasAndReluAndReQuantize.Options
transposeA (부울 전치 A)
정적 QuantizedMatMulWithBiasAndReluAndReQuantize.Options
transposeB (부울 전치 B)

상속된 메서드

공개 방법

public static QuantizedMatMulWithBiasAndReluAndReQuantize <W> create ( Scope 범위, Operand <T> a, Operand <U> b, Operand <V>bias, Operand <Float> minA, Operand <Float> maxA, Operand <Float> minB, Operand <Float > maxB, 피연산자 <Float> minFreezedOutput, 피연산자 <Float> maxFreezedOutput, Class<W> Toutput, 옵션... 옵션)

새로운 QuantizedMatMulWithBiasAndReluAndReQuantize 작업을 래핑하는 클래스를 생성하는 팩토리 메서드입니다.

매개변수
범위 현재 범위
곱할 행렬입니다. 'quint8' 유형의 2차원 텐서여야 합니다.
곱할 행렬이며 'qint8' 유형의 2차원 텐서여야 합니다.
편견 'b'의 내부 차원과 크기가 일치하는 1D 바이어스 텐서('transposed_b'가 0이 아닌 경우 전치된 후).
분A 가장 낮은 양자화된 `a` 값이 나타내는 부동 소수점 값입니다.
최대A 가장 높은 양자화된 `a` 값이 나타내는 부동 소수점 값입니다.
분B 가장 낮은 양자화된 `b` 값이 나타내는 부동 소수점 값입니다.
최대B 가장 높은 양자화된 'b' 값이 나타내는 부동 소수점 값입니다.
최소 고정 출력 재양자화 후 가장 높은 양자화된 출력 값인 부동 소수점 값입니다.
옵션 선택적 속성 값을 전달합니다.
보고
  • QuantizedMatMulWithBiasAndReluAndReQuantize의 새로운 인스턴스

공개 정적 QuantizedMatMulWithBiasAndReluAndReQuantize.Options inputQuantMode (문자열 inputQuantMode)

매개변수
입력QuantMode 입력 데이터 양자화 모드. MIN_FIRST(기본값) 또는 SCALED입니다.

공개 출력 <Float> maxOut ()

가장 높은 양자화된 출력 값이 나타내는 부동 소수점 값입니다.

공개 출력 <Float> minOut ()

가장 낮은 양자화된 출력 값이 나타내는 부동 소수점 값입니다.

공개 출력 <W> 출력 ()

공개 정적 QuantizedMatMulWithBiasAndReluAndReQuantize.Options transposeA (부울 transposeA)

매개변수
전치 A true인 경우 'a'는 곱하기 전에 전치됩니다.

공개 정적 QuantizedMatMulWithBiasAndReluAndReQuantize.Options transposeB (부울 전치 B)

매개변수
B true인 경우 'b'는 곱하기 전에 전치됩니다.