QuantizedMatMulWithBias

lớp cuối cùng công khai QuantizedMatMulWithBias

Thực hiện phép nhân ma trận lượng tử hóa của `a` với ma trận `b` với phép cộng độ lệch.

Đầu vào phải là ma trận hai chiều và vectơ sai lệch 1D. Và chiều bên trong của `a` (sau khi được chuyển đổi nếu `transpose_a` khác 0) phải khớp với chiều bên ngoài của `b` (sau khi được chuyển đổi nếu `transpose_b` khác 0). Sau đó thực hiện thao tác cộng quảng bá với các giá trị sai lệch trên kết quả nhân ma trận. Kích thước thiên vị phải khớp với kích thước bên trong của `b`.

Các lớp lồng nhau

lớp học Lượng tử hóaMatMulWithBias.Options Thuộc tính tùy chọn cho QuantizedMatMulWithBias

Hằng số

Sợi dây OP_NAME Tên của op này, được biết đến bởi công cụ lõi TensorFlow

Phương pháp công khai

tĩnh <W mở rộng TType > QuantizedMatMulWithBias <W>
tạo ( Phạm vi phạm vi, Toán hạng <? mở rộng TType > a, Toán hạng <? mở rộng TType > b, Toán hạng <? mở rộng TType > thiên vị, Toán hạng < TFloat32 > minA, Toán hạng < TFloat32 > maxA, Toán hạng < TFloat32 > minB, Toán hạng < TFloat32 > maxB, Class<W> Toutput, Tùy chọn... tùy chọn)
Phương thức xuất xưởng để tạo một lớp bao bọc một thao tác QuantizedMatMulWithBias mới.
tĩnh QuantizedMatMulWithBias.Options
inputQuantMode (Chuỗi đầu vàoQuantMode)
Đầu ra < TFloat32 >
maxOut ()
Giá trị float mà giá trị đầu ra lượng tử hóa cao nhất đại diện.
Đầu ra < TFloat32 >
phútOut ()
Giá trị float mà giá trị đầu ra lượng tử hóa thấp nhất đại diện.
Đầu ra <W>
ngoài ()
tĩnh QuantizedMatMulWithBias.Options
chuyển vịA (chuyển đổi BooleanA)
tĩnh QuantizedMatMulWithBias.Options
transposeB (chuyển đổi BooleanB)

Phương pháp kế thừa

Hằng số

Chuỗi cuối cùng tĩnh công khai OP_NAME

Tên của op này, được biết đến bởi công cụ lõi TensorFlow

Giá trị không đổi: "QuantizedMatMulWithBias"

Phương pháp công khai

public static QuantizedMatMulWithBias <W> create ( Phạm vi phạm vi , Toán hạng <? mở rộng TType > a, Toán hạng <? mở rộng TType > b, Toán hạng <? mở rộng TType > thiên vị, Toán hạng < TFloat32 > minA, Toán hạng < TFloat32 > maxA, Toán hạng < TFloat32 > minB, Toán hạng < TFloat32 > maxB, Lớp<W> Toutput, Tùy chọn... tùy chọn)

Phương thức xuất xưởng để tạo một lớp bao bọc một thao tác QuantizedMatMulWithBias mới.

Thông số
phạm vi phạm vi hiện tại
Một Một ma trận được nhân. Phải là tensor hai chiều thuộc loại `quint8`.
b Ma trận cần nhân và phải là tensor hai chiều thuộc loại `qint8`.
Thiên kiến Một tenxơ thiên vị 1D có kích thước khớp với kích thước bên trong của `b` (sau khi được hoán vị nếu `transpose_b` khác 0).
phútA Giá trị float mà giá trị `a` được lượng tử hóa thấp nhất đại diện.
tối đaA Giá trị float mà giá trị `a` được lượng tử hóa cao nhất đại diện.
phútB Giá trị float mà giá trị `b` được lượng tử hóa thấp nhất đại diện.
tối đaB Giá trị float mà giá trị `b` được lượng tử hóa cao nhất đại diện.
tùy chọn mang các giá trị thuộc tính tùy chọn
Trả lại
  • một phiên bản mới của QuantizedMatMulWithBias

tĩnh công khai QuantizedMatMulWithBias.Options inputQuantMode (Chuỗi đầu vàoQuantMode)

Thông số
đầu vàoQuantMode Chế độ lượng tử hóa dữ liệu đầu vào. MIN_FIRST(mặc định) hoặc SCALED.

Đầu ra công khai < TFloat32 > maxOut ()

Giá trị float mà giá trị đầu ra lượng tử hóa cao nhất đại diện.

Đầu ra công khai < TFloat32 > minOut ()

Giá trị float mà giá trị đầu ra lượng tử hóa thấp nhất đại diện.

Đầu ra công khai <W> out ()

tĩnh công khai QuantizedMatMulWithBias.Options transposeA (Boolean transposeA)

Thông số
chuyển vịA Nếu đúng, `a` được chuyển đổi trước khi nhân.

tĩnh công khai QuantizedMatMulWithBias.Options transposeB (Boolean transposeB)

Thông số
chuyển vịB Nếu đúng, `b` được chuyển đổi trước khi nhân.