QuantizedMatMulWithBias

lớp cuối cùng công khai QuantizedMatMulWithBias

Thực hiện phép nhân ma trận lượng tử hóa của `a` với ma trận `b` với phép cộng độ lệch.

Đầu vào phải là ma trận hai chiều và vectơ sai lệch 1D. Và chiều bên trong của `a` (sau khi được chuyển đổi nếu `transpose_a` khác 0) phải khớp với chiều bên ngoài của `b` (sau khi được chuyển đổi nếu `transpose_b` khác 0). Sau đó thực hiện thao tác cộng quảng bá với các giá trị sai lệch trên kết quả nhân ma trận. Kích thước thiên vị phải khớp với kích thước bên trong của `b`.

Các lớp lồng nhau

lớp học Lượng tử hóaMatMulWithBias.Options Thuộc tính tùy chọn cho QuantizedMatMulWithBias

Phương pháp công khai

tĩnh <W, T, U, V> Lượng tử hoáMatMulWithBias <W>
tạo ( Phạm vi phạm vi, Toán hạng <T> a, Toán hạng <U> b, Độ lệch Toán hạng <V>, Toán hạng <Float> minA, Toán hạng <Float> maxA, Toán hạng <Float> minB, Toán hạng <Float> maxB, Lớp<W > Toutput, Tùy chọn... tùy chọn)
Phương thức xuất xưởng để tạo một lớp bao bọc một thao tác QuantizedMatMulWithBias mới.
tĩnh QuantizedMatMulWithBias.Options
inputQuantMode (Chuỗi đầu vàoQuantMode)
Đầu ra <Float>
maxOut ()
Giá trị float mà giá trị đầu ra lượng tử hóa cao nhất đại diện.
Đầu ra <Float>
phútOut ()
Giá trị float mà giá trị đầu ra lượng tử hóa thấp nhất đại diện.
Đầu ra <W>
ngoài ()
tĩnh QuantizedMatMulWithBias.Options
chuyển vịA (chuyển đổi BooleanA)
tĩnh QuantizedMatMulWithBias.Options
transposeB (chuyển đổi BooleanB)

Phương pháp kế thừa

Phương pháp công khai

public static QuantizedMatMulWithBias <W> create ( Phạm vi phạm vi, Toán hạng <T> a, Toán hạng <U> b, Độ lệch Toán hạng <V>, Toán hạng <Float> minA, Toán hạng <Float> maxA, Toán hạng <Float> minB, Toán hạng <Float > maxB, Class<W> Toutput, Tùy chọn... tùy chọn)

Phương thức xuất xưởng để tạo một lớp bao bọc một thao tác QuantizedMatMulWithBias mới.

Thông số
phạm vi phạm vi hiện tại
Một Một ma trận được nhân. Phải là tensor hai chiều thuộc loại `quint8`.
b Ma trận cần nhân và phải là tensor hai chiều thuộc loại `qint8`.
Thiên kiến Một tenxơ thiên vị 1D có kích thước khớp với kích thước bên trong của `b` (sau khi được hoán vị nếu `transpose_b` khác 0).
phútA Giá trị float mà giá trị `a` được lượng tử hóa thấp nhất đại diện.
tối đaA Giá trị float mà giá trị `a` được lượng tử hóa cao nhất đại diện.
phútB Giá trị float mà giá trị `b` được lượng tử hóa thấp nhất đại diện.
tối đaB Giá trị float mà giá trị `b` được lượng tử hóa cao nhất đại diện.
tùy chọn mang các giá trị thuộc tính tùy chọn
Trả lại
  • một phiên bản mới của QuantizedMatMulWithBias

tĩnh công khai QuantizedMatMulWithBias.Options inputQuantMode (Chuỗi đầu vàoQuantMode)

Thông số
đầu vàoQuantMode Chế độ lượng tử hóa dữ liệu đầu vào. MIN_FIRST(mặc định) hoặc SCALED.

Đầu ra công khai <Float> maxOut ()

Giá trị float mà giá trị đầu ra lượng tử hóa cao nhất đại diện.

Đầu ra công khai <Float> minOut ()

Giá trị float mà giá trị đầu ra lượng tử hóa thấp nhất đại diện.

Đầu ra công khai <W> out ()

tĩnh công khai QuantizedMatMulWithBias.Options transposeA (Boolean transposeA)

Thông số
chuyển vịA Nếu đúng, `a` được chuyển đổi trước khi nhân.

tĩnh công khai QuantizedMatMulWithBias.Options transposeB (Boolean transposeB)

Thông số
chuyển vịB Nếu đúng, `b` được chuyển đổi trước khi nhân.