نشكرك على متابعة Google I / O. عرض جميع الجلسات عند الطلب مشاهدة عند الطلب

تينسورفلو :: العمليات :: QuantizeDownAndShrinkRange

#include <math_ops.h>

تحويل موتر "الإدخال" الكمي إلى "إخراج" أقل دقة ، باستخدام.

ملخص

التوزيع الفعلي للقيم لتعظيم استخدام عمق البت الأدنى وتعديل الحد الأدنى والحد الأقصى للنطاقات وفقًا لذلك.

[input_min، input_max] هي عوامات قياسية تحدد نطاق تفسير التعويم لبيانات "الإدخال". على سبيل المثال ، إذا كان input_min هو -1.0f و input_max هو 1.0f ، ونحن نتعامل مع بيانات quint16 الكمية ، فيجب تفسير القيمة 0 في بيانات 16 بت على أنها -1.0f ، و 65535 تعني 1.0f.

يحاول هذا المشغل الضغط على أكبر قدر ممكن من الدقة في الإخراج بعمق بت أقل عن طريق حساب القيم الفعلية الدنيا والقصوى الموجودة في البيانات. على سبيل المثال ، ربما لا يحتوي إدخال quint16 على قيم أقل من 16384 ولا تزيد قيمته عن 49152. هذا يعني أن نصف النطاق فقط مطلوب فعليًا ، وجميع تفسيرات الطفو بين -0.5f و 0.5f ، لذلك إذا أردنا ضغط البيانات في ناتج quint8 ، فيمكننا استخدام هذا النطاق بدلاً من النظري -1.0f إلى 1.0 f الذي يقترحه الإدخال min و max.

من الناحية العملية ، يكون هذا مفيدًا للغاية في الحصول على مخرجات من عمليات مثل QuantizedMatMul التي يمكن أن تنتج مخرجات بعمق بت أعلى من مدخلاتها وقد تحتوي على نطاقات إخراج محتملة كبيرة ، ولكن في الممارسة العملية يكون لها توزيع لقيم الإدخال يستخدم فقط جزء صغير من النطاق الممكن. من خلال تغذية هذا الخرج في هذا المشغل ، يمكننا تقليله من 32 بت إلى 8 مع الحد الأدنى من فقدان الدقة.

الحجج:

  • النطاق: كائن النطاق
  • input_min: القيمة العائمة التي تمثلها القيمة الدنيا للمدخلات الكمية.
  • input_max: القيمة العائمة التي تمثلها القيمة القصوى للمدخلات الكمية.
  • out_type: نوع الإخراج. يجب أن يكون عمق بت أقل من Tinput.

عائدات:

  • Output الإخراج
  • Output output_min: القيمة العائمة التي تمثلها قيمة المخرجات الكمية الدنيا.
  • Output output_max: القيمة العائمة التي تمثلها القيمة القصوى للمخرجات الكمية.

البنائين والمدمرين

QuantizeDownAndShrinkRange (const :: tensorflow::Scope & scope, :: tensorflow::Input input, :: tensorflow::Input input_min, :: tensorflow::Input input_max, DataType out_type)

السمات العامة

operation
output
output_max
output_min

السمات العامة

عملية

Operation operation

انتاج

::tensorflow::Output output

الإخراج_max

::tensorflow::Output output_max

الإخراج_ دقيقة

::tensorflow::Output output_min

الوظائف العامة

QuantizeDownAndShrinkRange

 QuantizeDownAndShrinkRange(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input input,
  ::tensorflow::Input input_min,
  ::tensorflow::Input input_max,
  DataType out_type
)