Các chỉ báo công bằng trên Nhúng văn bản TF-Hub

Trong hướng dẫn này, bạn sẽ học cách sử dụng chỉ số Công bằng để đánh giá embeddings từ TF Hub . Máy tính xách tay này sử dụng Civil Bình luận tập dữ liệu .

Thành lập

Cài đặt các thư viện cần thiết.

!pip install -q -U pip==20.2

!pip install fairness-indicators \
  "absl-py==0.12.0" \
  "pyarrow==2.0.0" \
  "apache-beam==2.34.0" \

Nhập các thư viện bắt buộc khác.

import os
import tempfile
import apache_beam as beam
from datetime import datetime
import tensorflow as tf
import tensorflow_hub as hub
import tensorflow_model_analysis as tfma
from tensorflow_model_analysis.addons.fairness.view import widget_view
from tensorflow_model_analysis.addons.fairness.post_export_metrics import fairness_indicators
from fairness_indicators import example_model
from fairness_indicators.tutorial_utils import util
Trong máy tính xách tay này, bạn làm việc với dân Bình luận tập dữ liệu , trong đó có khoảng 2 triệu ý kiến công chúng được công bố bởi các dân Bình luận nền tảng vào năm 2017 cho nghiên cứu liên tục. Nỗ lực này được tài trợ bởi Jigsaw, người đã tổ chức các cuộc thi trên Kaggle để giúp phân loại các bình luận độc hại cũng như giảm thiểu sự thiên vị người mẫu ngoài ý muốn.

Mỗi nhận xét văn bản riêng lẻ trong tập dữ liệu có một nhãn độc hại, với nhãn là 1 nếu nhận xét là độc hại và 0 nếu nhận xét không độc. Trong dữ liệu, một tập hợp con các nhận xét được gắn nhãn với nhiều thuộc tính nhận dạng, bao gồm các danh mục về giới tính, khuynh hướng tình dục, tôn giáo và chủng tộc hoặc sắc tộc.

Chuẩn bị dữ liệu

TensorFlow phân tích tính năng từ dữ liệu sử dụng tf.io.FixedLenFeaturetf.io.VarLenFeature . Vạch ra tính năng đầu vào, tính năng đầu ra và tất cả các tính năng cắt lát khác mà bạn quan tâm.

BASE_DIR = tempfile.gettempdir()

# The input and output features of the classifier
TEXT_FEATURE = 'comment_text'
LABEL = 'toxicity'

    # input and output features
    LABEL: tf.io.FixedLenFeature([], tf.float32),
    TEXT_FEATURE: tf.io.FixedLenFeature([], tf.string),

    # slicing features
    'sexual_orientation': tf.io.VarLenFeature(tf.string),
    'gender': tf.io.VarLenFeature(tf.string),
    'religion': tf.io.VarLenFeature(tf.string),
    'race': tf.io.VarLenFeature(tf.string),
    'disability': tf.io.VarLenFeature(tf.string)

IDENTITY_TERMS = ['gender', 'sexual_orientation', 'race', 'religion', 'disability']

Theo mặc định, sổ ghi chép tải xuống phiên bản được xử lý trước của tập dữ liệu này, nhưng bạn có thể sử dụng tập dữ liệu gốc và chạy lại các bước xử lý nếu muốn.

Trong tập dữ liệu ban đầu, mỗi nhận xét được gắn nhãn với tỷ lệ phần trăm người đánh giá tin rằng nhận xét tương ứng với một danh tính cụ thể. Ví dụ, một lời nhận xét có thể được dán nhãn với những điều sau đây: { male: 0.3, female: 1.0, transgender: 0.0, heterosexual: 0.8, homosexual_gay_or_lesbian: 1.0 } .

Bước xử lý nhóm danh tính theo danh mục (giới tính, định hướng tình dục, v.v.) và loại bỏ danh tính có điểm nhỏ hơn 0,5. Vì vậy, ví dụ trên sẽ được chuyển đổi thành như sau: của những người xếp hạng tin rằng một nhận xét tương ứng với một danh tính cụ thể. Ví dụ, bình luận trên sẽ được dán nhãn với những điều sau đây: { gender: [female], sexual_orientation: [heterosexual, homosexual_gay_or_lesbian] }

Tải xuống tập dữ liệu.

download_original_data = False

if download_original_data:
  train_tf_file = tf.keras.utils.get_file('train_tf.tfrecord',
  validate_tf_file = tf.keras.utils.get_file('validate_tf.tfrecord',

  # The identity terms list will be grouped together by their categories
  # (see 'IDENTITY_COLUMNS') on threshold 0.5. Only the identity term column,
  # text column and label column will be kept after processing.
  train_tf_file = util.convert_comments_data(train_tf_file)
  validate_tf_file = util.convert_comments_data(validate_tf_file)

  train_tf_file = tf.keras.utils.get_file('train_tf_processed.tfrecord',
  validate_tf_file = tf.keras.utils.get_file('validate_tf_processed.tfrecord',
Downloading data from https://storage.googleapis.com/civil_comments_dataset/train_tf_processed.tfrecord
488161280/488153424 [==============================] - 2s 0us/step
488169472/488153424 [==============================] - 2s 0us/step
Downloading data from https://storage.googleapis.com/civil_comments_dataset/validate_tf_processed.tfrecord
324943872/324941336 [==============================] - 9s 0us/step
324952064/324941336 [==============================] - 9s 0us/step

Tạo một đường ống phân tích mô hình TensorFlow

Thư viện Các chỉ số Công bằng hoạt động trên phân tích mẫu TensorFlow (TFMA) mô hình . Các mô hình TFMA bao gồm các mô hình TensorFlow với chức năng bổ sung để đánh giá và hình dung kết quả của chúng. Việc đánh giá thực tế xảy ra bên trong một đường ống Apache chùm .

Các bước bạn làm theo để tạo đường dẫn TFMA là:

  1. Xây dựng mô hình TensorFlow
  2. Xây dựng mô hình TFMA trên đầu mô hình TensorFlow
  3. Chạy phân tích mô hình trong bộ dàn nhạc. Mô hình ví dụ trong sổ tay này sử dụng Apache Beam làm bộ điều phối.
def embedding_fairness_result(embedding, identity_term='gender'):

  model_dir = os.path.join(BASE_DIR, 'train',

  print("Training classifier for " + embedding)
  classifier = example_model.train_model(model_dir,

  # Create a unique path to store the results for this embedding.
  embedding_name = embedding.split('/')[-2]
  eval_result_path = os.path.join(BASE_DIR, 'eval_result', embedding_name)

  return tfma.load_eval_result(output_path=eval_result_path)

Chạy TFMA & Chỉ báo Công bằng

Các chỉ số về chỉ số công bằng

Một số chỉ số có sẵn với Chỉ báo Công bằng là:

Nhúng văn bản

TF-Hub cung cấp một số embeddings văn bản. Các bản nhúng này sẽ đóng vai trò là cột tính năng cho các mô hình khác nhau. Hướng dẫn này sử dụng các cách nhúng sau:

Kết quả Chỉ báo Công bằng

Chỉ số công bằng tính toán với embedding_fairness_result đường ống, và sau đó làm cho các kết quả trong Công bằng chỉ số phụ tùng UI với widget_view.render_fairness_indicator cho tất cả các embeddings trên.

NNLM ngẫu nhiên

eval_result_random_nnlm = embedding_fairness_result('https://tfhub.dev/google/random-nnlm-en-dim128/1')
eval_result_nnlm = embedding_fairness_result('https://tfhub.dev/google/nnlm-en-dim128/1')
Bộ mã hóa câu vạn năng

eval_result_use = embedding_fairness_result('https://tfhub.dev/google/universal-sentence-encoder/2')
So sánh nhúng

Bạn cũng có thể sử dụng Chỉ báo công bằng để so sánh trực tiếp các lần nhúng. Ví dụ: so sánh các mô hình được tạo từ nhúng NNLM và USE.

widget_view.render_fairness_indicator(multi_eval_results={'nnlm': eval_result_nnlm, 'use': eval_result_use})
FairnessIndicatorViewer(evalName='nnlm', evalNameCompare='use', slicingMetrics=[{'sliceValue': 'Overall', 'sli…