12 月 7 日の Women in ML シンポジウムに参加する今すぐ登録する
コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

TensorFlowモデル修復とは何ですか?

機械学習モデルで公平性の懸念を特定した場合、利用可能な技術的介入には3つの主要なタイプがあります。

  • データ前処理技術のトレーニング:より多くのデータを収集し、合成データを生成し、例の重みを調整し、さまざまなスライスのサンプリングレートを調整します。
  • トレーニング時のモデリング手法:モデルの目的を導入または変更し、制約を追加することにより、モデル自体を変更します。
  • トレーニング後の手法:モデルの出力または出力の解釈を変更して、メトリック全体のパフォーマンスを向上させます。
TensorFlowモデル修復ライブラリは、モデルに介入するためのトレーニング時間の手法を提供します。

トレーニング時間モデリング

TensorFlowモデル修復ライブラリは、モデルのバイアスと公平性の問題に対処するための2つの手法、 MinDiffCounterfactual Logit Pairing(CLP)を提供します。以下の表で説明します。

MinDiff CLP
このテクニックはいつ使うべきですか?

モデルが機密属性のすべての値に対して優先ラベルを等しく適切に予測することを保証するため。

機会のグループ平等を達成するため。

モデルの予測が「カウンターファクトペア」間で変更されないようにするため(フィーチャで参照される機密属性が異なる場合)。たとえば、毒性分類子では、「私は男性です」と「私はレズビアンです」などの例は、異なる予測を持つべきではありません。

ある種の事実に反する公平性を達成するため。

それはどのように機能しますか? 2つのセット間のスコアの分布の違いについて、トレーニング中にモデルにペナルティを課します。例の反事実的なペア間の出力の違いについて、トレーニング中にモデルにペナルティを課します。
入力モダリティ損失関数は出力で動作するため、理論的には、入力およびモデルのアーキテクチャに依存しません。損失関数は出力で動作するため、理論的には、入力およびモデルのアーキテクチャに依存しません。