ضرب ماتریس کوانتیزه «a» در ماتریس «b» را با بایاس جمع انجام می دهد.
ورودی ها باید ماتریس های دو بعدی و بردار بایاس 1 بعدی باشند. و بعد داخلی «a» (پس از جابجایی اگر «transpose_a» غیر صفر باشد) باید با بعد بیرونی «b» مطابقت داشته باشد (بعد از جابجایی اگر «transposed_b» غیر صفر باشد). سپس عملیات اضافه کردن پخش را با مقادیر بایاس در نتیجه ضرب ماتریس انجام دهید. اندازه بایاس باید با بعد داخلی «b» مطابقت داشته باشد.
کلاس های تو در تو
کلاس | QuantizedMatMulWithBias.Options | ویژگی های اختیاری برای QuantizedMatMulWithBias |
روش های عمومی
استاتیک <W, T, U, V> QuantizedMatMulWithBias <W> | |
استاتیک QuantizedMatMulWithBias.Options | inputQuantMode (رشته ورودیQuantMode) |
خروجی <Float> | حداکثر کردن () مقدار شناور که بالاترین مقدار خروجی کوانتیزه شده نشان دهنده آن است. |
خروجی <Float> | minOut () مقدار شناوری که کمترین مقدار خروجی کوانتیزه شده نشان دهنده آن است. |
خروجی <W> | بیرون () |
استاتیک QuantizedMatMulWithBias.Options | transposeA (transposeA Boolean) |
استاتیک QuantizedMatMulWithBias.Options | transposeB (transposeB) |
روش های ارثی
روش های عمومی
عمومی استاتیک QuantizedMatMulWithBias <W> ایجاد ( دامنه دامنه ، عملوند <T> a، عملوند <U> b، عملوند <V> بایاس، عملوند <Float> minA، عملوند <Float> maxA، عملوند <Float> minB، عملوند <Float > maxB، Class<W> Toutput، گزینهها... گزینهها)
روش کارخانه برای ایجاد کلاسی که یک عملیات جدید QuantizedMatMulWithBias را بسته بندی می کند.
مولفه های
محدوده | محدوده فعلی |
---|---|
آ | ماتریسی که باید ضرب شود. باید یک تانسور دو بعدی از نوع «quiint8» باشد. |
ب | ماتریسی که باید ضرب شود و باید یک تانسور دو بعدی از نوع 'qint8' باشد. |
جانبداری | یک تانسور بایاس 1 بعدی با ابعاد داخلی «b» منطبق بر اندازه (اگر «transposed_b» غیرصفر باشد، پس از جابجایی). |
minA | مقدار شناور که کمترین مقدار «a» کوانتیزه شده نشان دهنده آن است. |
maxA | مقدار شناور که بالاترین مقدار «a» کوانتیزه شده نشان دهنده آن است. |
minB | مقدار شناور که کمترین مقدار «b» کوانتیزه شده نشان دهنده آن است. |
maxB | مقدار شناور که بالاترین مقدار «b» کوانتیزه شده نشان دهنده آن است. |
گزینه ها | مقادیر ویژگی های اختیاری را حمل می کند |
برمی گرداند
- یک نمونه جدید از QuantizedMatMulWithBias
عمومی استاتیک QuantizedMatMulWithBias.Options inputQuantMode (رشته ورودیQuantMode)
مولفه های
inputQuantMode | حالت کوانتیزاسیون داده های ورودی MIN_FIRST (پیشفرض) یا SCALED. |
---|
عمومی استاتیک QuantizedMatMulWithBias.Options transposeA (transposeA Boolean)
مولفه های
انتقال A | اگر درست باشد، «a» قبل از ضرب جابهجا میشود. |
---|
عمومی استاتیک QuantizedMatMulWithBias.Options transposeB (transposeB بولی)
مولفه های
transposeB | اگر درست باشد، «b» قبل از ضرب جابهجا میشود. |
---|