השב / י לאירוע TensorFlow Everywhere המקומי שלך היום!
דף זה תורגם על ידי Cloud Translation API.
Switch to English

אופטימיזציה של מודל TensorFlow

ערכת הכלים למיטוב המודל של TensorFlow ממזערת את המורכבות של אופטימיזציה של הסקת למידה ממוחשבת.

יעילות המסקנות היא עניין קריטי בעת פריסת מודלים של למידת מכונה בגלל חביון, ניצול זיכרון ובמקרים רבים צריכת חשמל. במיוחד במכשירי קצה, כגון IoT, נייד ואינטרנט של דברים, משאבים מוגבלים עוד יותר, וגודל המודל והיעילות של החישוב הופכים לדאגה מרכזית.

הביקוש החישובי להכשרה גדל עם מספר המודלים שהוכשרו בארכיטקטורות שונות, ואילו הביקוש החישובי להסקה גדל ביחס למספר המשתמשים.

השתמש במקרים

אופטימיזציה למודל שימושית, בין היתר, עבור:

  • הפחתת זמן ההשהיה ועלות ההסקה הן עבור מכשירי ענן והן עבור מכשירי קצה (למשל נייד, IoT).
  • פריסת דגמים במכשירי קצה עם הגבלות על עיבוד, זיכרון ו / או צריכת חשמל.
  • הפחתת גודל המטען לעדכוני מודל אוויר.
  • הפעלת ביצוע בחומרה המוגבלת לפעולות נקודה קבועה או מותאמת להן.
  • אופטימיזציה של דגמים למאיצי חומרה ייעודיים מיוחדים.

טכניקות אופטימיזציה

תחום האופטימיזציה של המודל יכול לכלול טכניקות שונות:

  • צמצמו את ספירת הפרמטרים בעזרת גיזום וגיזום מובנה.
  • הפחת את הדיוק הייצוגי בעזרת כימות.
  • עדכן את הטופולוגיה המקורית של המודל ליעיל יותר עם פרמטרים מופחתים או ביצוע מהיר יותר. לדוגמא, שיטות פירוק טנסור וזיקוק

ערכת הכלים שלנו תומכת בכימות כיוון לאחר אימון , הכשרה מודעת לכימות , גיזום ואשכולות .

כימות

מודלים מכמתים הם אלה שבהם אנו מייצגים את הדגמים בדיוק נמוך יותר, כגון מספרים שלמים של 8 סיביות לעומת צף של 32 סיביות. דיוק נמוך יותר הוא דרישה למינוף חומרה מסוימת.

דלילות וגיזום

מודלים דלילים הם כאלה שבהם גוזמו חיבורים בין אופרטורים (כלומר שכבות רשת עצביות), והכניסו אפסים לפרמטר טנזרים.

אשכולות

מודלים מקובצים הם אלה שבהם מוחלפים הפרמטרים של המודל המקורי במספר קטן יותר של ערכים ייחודיים.