האזן הנשים הראשונות ML סימפוזיון שלישי הקרוב, -19 לאוקטובר שעה 09:00 PST הרשם עכשיו

זרימת טנסור :: אופ :: QuantizeDownAndShrinkRange

#include <math_ops.h>

המר את טנסור הכניסה 'הכמותי' ל'פלט 'עם דיוק נמוך יותר, באמצעות.

סיכום

התפלגות בפועל של הערכים כדי למקסם את השימוש בעומק הסיביות התחתון והתאמת טווחי המינימום והמקסימום של הפלט בהתאם.

[input_min, input_max] הם צף סקלרי המציין את הטווח לפרשנות הצף של נתוני 'קלט'. לדוגמה, אם input_min הוא -1.0f ו- input_max הוא 1.0f, ואנחנו עוסקים בנתונים קוונטיים של quint16, אז יש לפרש ערך 0 בנתוני 16-bit כ -1.0f, ו- 65535 פירושו 1.0f.

מפעיל זה מנסה לדחוס כמה שיותר דיוק לפלט עם עומק סיביות נמוך יותר על ידי חישוב ערכי המינימום והמקסימום שנמצאו בנתונים. לדוגמא, אולי לאותו קלט quint16 אין ערכים הנמוכים מ- 16,384 ואינם גבוהים מ- 49,152. זה אומר שרק מחצית הטווח נחוץ בפועל, כל הפרשנויות לצוף הן בין -0.5f ל 0.5f, כך שאם אנחנו רוצים לדחוס את הנתונים לפלט quint8, נוכל להשתמש בטווח זה ולא בתאורטי -1.0f עד 1.0 המוצעת על ידי הקלט מינימום ומקסימום.

בפועל, הדבר שימושי ביותר לצורך לקיחת תפוקה מפעולות כמו QuantizedMatMul שיכולות לייצר יציאות עומק סיביות גבוהות יותר מהתשומות שלהן ועשויות להיות בטווחי פלט פוטנציאליים גדולים, אך בפועל יש התפלגות של ערכי קלט המשתמשת רק בחלק קטן מה טווח אפשרי. על ידי הזנת הפלט למפעיל זה, אנו יכולים להפחית אותו מ -32 סיביות למטה ל- 8 עם אובדן דיוק מינימלי.

טענות:

  • היקף: אובייקט Scope
  • input_min: ערך הצף שמייצג ערך הקלט הכמותי המינימלי.
  • input_max: ערך הצף שמייצג ערך הקלט הכמותי המרבי.
  • out_type: סוג הפלט. צריך להיות בעומק סיביות נמוך יותר מ- Tinput.

החזרות:

  • Output תפוקה
  • Output פלט_מין: ערך הצף שערך הפלט הכמותי המינימלי מייצג.
  • Output output_max: ערך הצף שערך הפלט הכמותי המרבי מייצג.

קונסטרוקטורים ומשחתנים

QuantizeDownAndShrinkRange (const :: tensorflow::Scope & scope, :: tensorflow::Input input, :: tensorflow::Input input_min, :: tensorflow::Input input_max, DataType out_type)

תכונות ציבוריות

operation
output
output_max
output_min

תכונות ציבוריות

מבצע

Operation operation

תְפוּקָה

::tensorflow::Output output

פלט_מקס

::tensorflow::Output output_max

output_min

::tensorflow::Output output_min

פונקציות ציבוריות

QuantizeDownAndShrinkRange

 QuantizeDownAndShrinkRange(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input input,
  ::tensorflow::Input input_min,
  ::tensorflow::Input input_max,
  DataType out_type
)