מהו תיקון מודל TensorFlow?

אם זיהית חששות מהוגנות עם מודל למידת המכונה שלך, ישנם שלושה סוגים עיקריים של התערבויות טכניות זמינות:

  • אימון טכניקות עיבוד מקדים של נתונים: איסוף נתונים נוספים, הפקת נתונים סינתטיים, התאמת משקלים של דוגמאות וקצבי דגימה של פרוסות שונות.
  • טכניקות מידול בזמן אימון: שינוי המודל עצמו על ידי הצגת או שינוי יעדי המודל והוספת אילוצים.
  • טכניקות לאחר אימון: שינוי התפוקות של המודל או הפרשנות של התפוקות כדי לשפר ביצועים על פני מדדים.
ספריית TensorFlow Model Remediation מספקת טכניקות בזמן אימון להתערבות במודל.

דוגמנות בזמן אימון

ספריית TensorFlow Model Remediation מספקת שתי טכניקות לטיפול בבעיות הטיה והגינות במודל שלך, MinDiff ו- Counterfactual Logit Pairing (CLP) . הם מתוארים בטבלה למטה.

MinDiff CLP
מתי כדאי להשתמש בטכניקה זו?

כדי להבטיח שמודל מנבא את התווית המועדפת באותה מידה עבור כל הערכים של תכונה רגישה.

להשיג שוויון הזדמנויות קבוצתי.

כדי להבטיח שחיזוי של מודל לא ישתנה בין "צמדים נגד עובדתיים" (כאשר התכונה הרגישה אליה מתייחסים בתכונה שונה). לדוגמה, במסווג רעילות , דוגמאות כגון "אני גבר" ו"אני לסבית" לא אמורות להיות תחזית שונה.

להשיג סוג של הוגנות נגד עובדתית .

איך זה עובד? מעניש את המודל במהלך האימון על הבדלים בחלוקת הציונים בין שתי הסטים. מעניש את המודל במהלך האימון על הבדלי תפוקה בין זוגות קונטרה-עובדתיים של דוגמאות .
אופני קלט פונקציות הפסד פועלות על פלט ולכן הן, בתיאוריה, אגנוסטיות לארכיטקטורת הקלט והמודל. פונקציות הפסד פועלות על פלט ולכן הן, בתיאוריה, אגנוסטיות לארכיטקטורת הקלט והמודל.