Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

Qu'est-ce que la correction du modèle TensorFlow ?

Si vous avez identifié des problèmes d'équité avec votre modèle d'apprentissage automatique, trois principaux types d'interventions techniques sont disponibles :

  • Formation aux techniques de prétraitement des données : collecte de plus de données, génération de données synthétiques, ajustement des poids des exemples et des taux d'échantillonnage des différentes tranches.
  • Techniques de modélisation du temps de formation : modifier le modèle lui-même en introduisant ou en modifiant les objectifs du modèle et en ajoutant des contraintes.
  • Techniques post-formation : modification des sorties du modèle ou de l'interprétation des sorties pour améliorer les performances sur l'ensemble des métriques.
La bibliothèque TensorFlow Model Remediation fournit des techniques de temps de formation pour intervenir sur le modèle.

Modélisation du temps de formation

La bibliothèque TensorFlow Model Remediation fournit deux techniques pour résoudre les problèmes de biais et d'équité dans votre modèle, MinDiff et Counterfactual Logit Pairing (CLP) . Ils sont décrits dans le tableau ci-dessous.

DiffMin CLP
Quand utiliser cette technique ?

Pour s'assurer qu'un modèle prédit l'étiquette préférée de la même manière pour toutes les valeurs d'un attribut sensible.

Atteindre l' égalité des chances en groupe.

Pour s'assurer que la prédiction d'un modèle ne change pas entre les "paires contrefactuelles" (où l'attribut sensible référencé dans une caractéristique est différent). Par exemple, dans un classificateur de toxicité , des exemples tels que "Je suis un homme" et "Je suis une lesbienne" ne doivent pas avoir une prédiction différente.

Atteindre une forme d' équité contrefactuelle .

Comment ça marche? Pénalise le modèle pendant l'entraînement pour les différences dans la distribution des scores entre les deux ensembles. Pénalise le modèle pendant la formation pour les différences de sortie entre les paires contrefactuelles d'exemples .
Modalités d'entrée Les fonctions de perte agissent sur la sortie et sont donc, en théorie, indépendantes de l'entrée et de l'architecture du modèle. Les fonctions de perte agissent sur la sortie et sont donc, en théorie, indépendantes de l'entrée et de l'architecture du modèle.