השב / י לאירוע TensorFlow Everywhere המקומי שלך היום!
דף זה תורגם על ידי Cloud Translation API.
Switch to English

מהי תיקון מודלים?

לאחר שביצעת הערכה פרוסה של הביצועים של מודל למידת מכונה, ייתכן שתבחין שהמודל שלך ביצועים נמוכים על פני פרוסות נתונים מסוימות. ביצועים לא שווים מסוג זה יכולים לעיתים להוביל לתוצאות בלתי הוגנות ועלולות להזיק לתתי קבוצות אוכלוסייה פגיעות. ככלל, ישנם שלושה סוגים עיקריים של התערבויות טכניות לטיפול בבעיות הטיה:

  • שינוי נתון הקלט: איסוף נתונים נוספים, יצירת נתונים סינטטי, התאמה משקול דגימת שיעורי פרוסות שונות, וכו '1
  • התערבות לדגם: שינוי המודל עצמו על ידי החדרת או מטרות מודל שינוי, הוספת אילוצים, וכו '2
  • עיבוד לאחר התוצאות: שינוי תפוקות המודל או פרשנות התפוקות לשיפור הביצועים במדדים. 3

from tensorflow_model_remediation import min_diff
import tensorflow as tf

# Start by defining a Keras model.
original_model = ...

# Set the MinDiff weight and choose a loss.
min_diff_loss = min_diff.losses.MMDLoss()
min_diff_weight = 1.0  # Hyperparamater to be tuned.

# Create a MinDiff model.
min_diff_model = min_diff.keras.MinDiffModel(
original_model, min_diff_loss, min_diff_weight)

# Compile the MinDiff model normally.
min_diff_model.compile(...)

# Create a MinDiff Dataset and train the min_diff_model.
min_diff_model.fit(min_diff_dataset, ...)

מה זה MinDiff?

MinDiff היא טכניקת שיקום מודל המבקשת להשוות בין שתי התפלגויות. בפועל, ניתן להשתמש בו כדי לאזן את שיעורי השגיאה בין פרוסות נתונים שונות על ידי עונש על הבדלי חלוקה.

בדרך כלל, אנו מיישמים את MinDiff כאשר מנסים למזער את ההבדל בשיעור חיובי כוזב (FPR) או בשיעור שלילי כוזב (FNR) בין פרוסת נתונים השייכת למחלקה רגישה לפרוסה בעלת ביצועים טובים יותר. לדיון מעמיק על מדדי ההגינות, עיין בספרות בנושא זה. 4 5 6

כיצד פועלת MinDiff?

בהינתן שתי קבוצות של דוגמאות ממערך הנתונים שלנו, MinDiff מעניש את המודל במהלך האימון על הבדלים בחלוקת הציונים בין שתי המערכות. ככל ששתי המערכות פחות מובחנות מבוססות על ציוני חיזוי, כך העונש שיוחל יהיה קטן יותר.

העונש מוחל על ידי הוספת רכיב לאובדן איתו מתאמן המודל. אפשר לחשוב על זה כמדידה של ההבדל בהתפלגות תחזיות המודל. כאשר המודל מתאמן, הוא ינסה למזער את העונש על ידי קירוב ההפצות, כמו בתרשים לעיל.

הגשת מינדיף עשויה להגיע עם פשרות בגין ביצוע המטלה המקורית. בפועל, לעיתים קרובות מצאנו ש- MinDiff יעילה תוך שהיא לא מחמירה את הביצועים מעבר לצרכי המוצר, אך זה יהיה תלוי ביישום וההחלטה צריכה להתקבל במכוון על ידי בעל המוצר. לדוגמאות המראות כיצד ליישם את MinDiff, עיין במדריך המחברת שלנו .

1 Zhang, G., Bai, B., Zhang, J., Bai, K., Zhu, C., Zhao, T. (2020). דמוגרפיה לא צריכה להיות הסיבה לרעילות: הפגת אפליה בסיווגי טקסטים בשקלול מופעים.
2 Prost, F., Qian H., Chen, Q., Chi, E., Chen, J., Beutel, A. (2019). לקראת פשרה טובה יותר בין ביצועים והגינות עם התאמת הפצה מבוססת גרעינים.
3 Alabdulmohsin, I. (2020). סיווג הוגן באמצעות אופטימיזציה בלתי מוגבלת.
4 Dwork, C., Hardt, M., Pitassi, T., Reingold, O., Zemel, R. (2011). הוגנות באמצעות מודעות.
5 Hardt, M., Price, E., Srebro, N. (2016). שוויון הזדמנויות בלמידה מפוקחת.
6 Chouldechova, A. (2016). חיזוי הוגן עם השפעה נפרדת: מחקר על הטיה במכשירי חיזוי רצידיביזם.

אֶמְצָעִי