דף זה תורגם על ידי Cloud Translation API.
Switch to English

מיטוב מודל TensorFlow

ערכת הכלים לביצוע אופטימיזציה של מודלים TensorFlow ממזערת את המורכבות של אופטימיזציה להסקת למידת מכונה.

יעילות ההערכה היא חשש קריטי בעת פריסת מודלים של למידת מכונה בגלל חביון, ניצול זיכרון ובמקרים רבים צריכת חשמל. במיוחד במכשירי קצה, כמו ניידים ואינטרנט של הדברים (IoT), משאבים מוגבלים עוד יותר, וגודל הדגם ויעילות החישוב הופכים לדאגה מרכזית.

הביקוש החישובי לאימונים גדל עם מספר הדגמים שהוכשרו על ארכיטקטורות שונות, ואילו הדרישה החישובית להסקה גדלה ביחס למספר המשתמשים.

השתמש במקרים

מיטוב מודלים מועיל, בין היתר, ל:

  • הפחתת השהיית ועלות ההסקה הן עבור מכשירי ענן והן קצה (למשל ניידים, IoT).
  • פריסת דגמים במכשירי קצה עם הגבלות על עיבוד, זיכרון ו / או צריכת חשמל.
  • צמצום גודל העומס בעדכוני מודלים בשידור חי.
  • הפעלת ביצוע בחומרה מוגבלת לפעולות עם נקודה קבועה או אופטימיזציה.
  • אופטימיזציה של דגמים למאישי חומרה ייעודיים.

טכניקות אופטימיזציה

תחום מיטוב הדגמים יכול לכלול טכניקות שונות:

  • צמצם את ספירת הפרמטרים בעזרת גיזום וגיזום מובנה.
  • צמצם את הדיוק הייצוגי בעזרת הכימות.
  • עדכן את טופולוגיית הדגם המקורית ליעילה יותר עם פרמטרים מופחתים או ביצוע מהיר יותר. לדוגמא, שיטות פירוק וטנסור

ערכת הכלים שלנו תומכת בכימות לאחר אימון , אימון מודע לכימות , גיזום ואשכול .

כימות

דגמים כמותיים הם אלה שבהם אנו מייצגים את הדגמים ברמת דיוק נמוכה יותר, כמו מספרים שלמים של 8 סיביות לעומת ציפה של 32 סיביות. דיוק נמוך יותר הוא דרישה למינוף חומרה מסוימת.

דלילות וגיזום

מודלים דלילים הם אלה שבהם גוזמים חיבורים בין מפעילים (כלומר שכבות רשת עצביות), ומכניסים אפסים לטנסור הפרמטר.

אשכולות

דגמים מקובצים הם אלה שבהם הפרמטרים של הדגם המקורי מוחלפים במספר קטן יותר של ערכים ייחודיים.