QuantizeDownAndShrinkRange

שיעור הגמר הציבורי QuantizeDownAndShrinkRange

המר את טנסור ה-'קלט' המכומתי ל'פלט' בעל דיוק נמוך יותר, באמצעות ה-

הפצה בפועל של הערכים כדי למקסם את השימוש בעומק הסיביות התחתון והתאמת טווחי המינימום והמקסימום של הפלט בהתאם.

[input_min, input_max] הם צפים סקלאריים המציינים את הטווח עבור פרשנות הציפה של נתוני 'הקלט'. לדוגמה, אם input_min הוא -1.0f ו-input_max הוא 1.0f, ואנו עוסקים בנתונים quantized quant16, אז יש לפרש ערך 0 בנתונים של 16 סיביות כ-1.0f, ו-65535 פירושו 1.0f.

אופרטור זה מנסה לסחוט כמה שיותר דיוק לתוך פלט עם עומק סיביות נמוך יותר על ידי חישוב ערכי המינימום והמקסימום בפועל שנמצאו בנתונים. לדוגמה, אולי לקלט של quint16 אין ערכים נמוכים מ-16,384 ואף לא גבוה מ-49,152. זה אומר שרק חצי מהטווח נחוצים בפועל, כל הפירושים הצפים הם בין -0.5f ל-0.5f, כך שאם אנחנו רוצים לדחוס את הנתונים לפלט quint8, נוכל להשתמש בטווח הזה ולא ב-1.0f התיאורטי עד 1.0 f המוצע על ידי הקלט min ו-max.

בפועל, זה שימושי ביותר עבור נטילת פלט מפעולות כמו QuantizedMatMul שיכולות לייצר פלטים בעומק סיביות גבוהים יותר מהכניסות שלהן ועשויות להיות בעלות טווחי פלט פוטנציאליים גדולים, אך בפועל יש להן התפלגות ערכי קלט שמשתמשת רק בחלק קטן של טווח אפשרי. על ידי הזנת הפלט לאופרטור הזה, נוכל לצמצם אותו מ-32 סיביות ל-8 עם אובדן דיוק מינימלי.

קבועים

חוּט OP_NAME השם של המבצע הזה, כפי שידוע על ידי מנוע הליבה של TensorFlow

שיטות ציבוריות

static <U מרחיב את TType > QuantizeDownAndShrinkRange <U>
create ( scope scope, Operand <? מרחיב את TType > input, Operand < TFloat32 > inputMin, Operand < TFloat32 > inputMax, Class<U> outType)
שיטת Factory ליצירת מחלקה העוטפת פעולת QuantizeDownAndShrinkRange חדשה.
פלט <U>
פלט ()
פלט < TFloat32 >
OutputMax ()
הערך הצף שערך הפלט המקוונטי המקסימלי מייצג.
פלט < TFloat32 >
outputMin ()
הערך הצף שערך הפלט המקוונטי המינימלי מייצג.

שיטות בירושה

קבועים

מחרוזת סופית סטטית ציבורית OP_NAME

השם של המבצע הזה, כפי שידוע על ידי מנוע הליבה של TensorFlow

ערך קבוע: "QuantizeDownAndShrinkRange"

שיטות ציבוריות

public static QuantizeDownAndShrinkRange <U> create ( scope scope, Operand <? מרחיב את TType > input, Operand < TFloat32 > inputMin, Operand < TFloat32 > inputMax, Class<U> outType)

שיטת Factory ליצירת מחלקה העוטפת פעולת QuantizeDownAndShrinkRange חדשה.

פרמטרים
תְחוּם ההיקף הנוכחי
inputMin הערך הצף שערך הקלט המקוונטי המינימלי מייצג.
inputMax הערך הצף שערך הקלט המקוונטי המקסימלי מייצג.
outType סוג הפלט. צריך להיות עומק סיביות נמוך יותר מ- Tinput.
החזרות
  • מופע חדש של QuantizeDownAndShrinkRange

פלט ציבורי <U> פלט ()

פלט ציבורי < TFloat32 > outputMax ()

הערך הצף שערך הפלט המקוונטי המקסימלי מייצג.

פלט ציבורי < TFloat32 > outputMin ()

הערך הצף שערך הפלט המקוונטי המינימלי מייצג.