अपने स्थानीय TensorFlow के लिए RSVP आज हर जगह घटना!
इस पेज का अनुवाद Cloud Translation API से किया गया है.
Switch to English

क्या है मॉडल रेमेडिएशन?

एक बार जब आपने मशीन सीखने के मॉडल के प्रदर्शन का कटा हुआ मूल्यांकन किया है, तो आप नोटिस कर सकते हैं कि आपका मॉडल डेटा के कुछ स्लाइस में कमजोर है। इस प्रकार का असमान प्रदर्शन कभी-कभी आबादी के कमजोर उपसमूह के लिए अनुचित और संभावित हानिकारक परिणामों का कारण बन सकता है। आम तौर पर, पूर्वाग्रह की चिंताओं को दूर करने के लिए तीन प्राथमिक तकनीकी हस्तक्षेप हैं:

  • इनपुट डेटा को बदलना: अधिक डेटा एकत्र करना, सिंथेटिक डेटा उत्पन्न करना, वजन को समायोजित करना और विभिन्न स्लाइस के नमूने दर आदि। 1
  • मॉडल पर हस्तक्षेप करना: मॉडल के उद्देश्यों को शुरू करने या बदलने के द्वारा मॉडल को बदलना, बाधाओं को जोड़ना, आदि 2
  • परिणामों को पोस्ट-प्रोसेस करना : मैट्रिक्स में प्रदर्शन में सुधार के लिए मॉडल के आउटपुट या आउटपुट की व्याख्या को संशोधित करना।

from tensorflow_model_remediation import min_diff
import tensorflow as tf

# Start by defining a Keras model.
original_model = ...

# Set the MinDiff weight and choose a loss.
min_diff_loss = min_diff.losses.MMDLoss()
min_diff_weight = 1.0  # Hyperparamater to be tuned.

# Create a MinDiff model.
min_diff_model = min_diff.keras.MinDiffModel(
original_model, min_diff_loss, min_diff_weight)

# Compile the MinDiff model normally.
min_diff_model.compile(...)

# Create a MinDiff Dataset and train the min_diff_model.
min_diff_model.fit(min_diff_dataset, ...)

MinDiff क्या है?

MinDiff एक मॉडल सुधारात्मक तकनीक है जो दो वितरणों को बराबर करने की कोशिश करता है। व्यवहार में, इसका उपयोग वितरण के अंतर को दंडित करके आपके डेटा के विभिन्न स्लाइस में त्रुटि दर को संतुलित करने के लिए किया जा सकता है।

आमतौर पर, कोई भी एक संवेदनशील वर्ग और बेहतर प्रदर्शन करने वाले स्लाइस के डेटा के स्लाइस के बीच गलत सकारात्मक दर (FPR) या झूठी नकारात्मक दर (FNR) में अंतर को कम करने की कोशिश करते समय मिनिफ़ लागू करता है। निष्पक्षता मीट्रिक की गहन चर्चा के लिए, इस विषय पर साहित्य की समीक्षा करें। ४ ५ ६

MinDiff कैसे काम करता है?

हमारे डेटासेट से दो सेटों के उदाहरणों को देखते हुए, MinDiff दो सेटों के बीच स्कोर के वितरण में अंतर के लिए प्रशिक्षण के दौरान मॉडल को दंडित करता है। दो सेटों में कम अंतर होने का अनुमान भविष्यवाणी के अंकों पर आधारित होता है, जितना छोटा जुर्माना लगाया जाएगा।

जुर्माना एक घटक को उस नुकसान से जोड़कर लगाया जाता है जिसके साथ मॉडल प्रशिक्षण कर रहा है। इसे मॉडल भविष्यवाणियों के वितरण में अंतर के माप के रूप में सोचा जा सकता है। मॉडल ट्रेनों के रूप में, यह उपरोक्त ग्राफ़ की तरह, वितरणों को एक साथ लाकर जुर्माना को कम करने की कोशिश करेगा।

मिनिफ़ लागू करने से मूल कार्य पर प्रदर्शन के संबंध में ट्रेडऑफ़ आ सकते हैं। व्यवहार में, हमने अक्सर मिनिफ़ को प्रभावी पाया है जबकि उत्पाद की ज़रूरतों से परे प्रदर्शन खराब नहीं हुआ है, लेकिन यह आवेदन पर निर्भर होगा और उत्पाद के मालिक द्वारा निर्णय जानबूझकर किया जाना चाहिए। उदाहरण के लिए दिखाते हैं कि मिनिफ को कैसे लागू किया जाए, हमारे नोटबुक ट्यूटोरियल को देखें।

1 झांग, जी।, बाई, बी।, झांग, जे।, बाई, के।, झू, सी।, झाओ, टी। (2020)। जनसांख्यिकी को विषाक्तता का कारण नहीं होना चाहिए: इंस्टेंस वेटिंग के साथ पाठ वर्गीकरणों में भेदभाव को कम करना।
2 प्रोस्ट, एफ।, कियान एच।, चेन, क्यू।, ची, ई।, चेन, जे।, बेउटल, ए। (2019)। कर्नेल-आधारित वितरण मिलान के साथ प्रदर्शन और निष्पक्षता के बीच एक बेहतर व्यापार-बंद की ओर।
3 अलबदुल्मोहिन, आई (2020)। निष्पक्ष वर्गीकरण के माध्यम से उचित वर्गीकरण।
4 Dwork, C., Hardt, M., Pitassi, T., Reingold, O., Zemel, R. (2011)। जागरूकता के माध्यम से निष्पक्षता।
5 हार्ड्ट, एम।, मूल्य, ई।, स्रेब्रो, एन। (2016)। सुपरवाइज्ड लर्निंग में अवसर की समानता।
6 चोलेचोवा, ए (2016)। असमान प्रभाव के साथ निष्पक्ष भविष्यवाणी: वैराग्य भविष्यवाणी उपकरणों में पूर्वाग्रह का अध्ययन।

संसाधन