شاخص‌های انصاف در جاسازی‌های متن TF-Hub

در این آموزش، شما یاد بگیرند که چگونه به استفاده از شاخص انصاف به ارزیابی درونه گیریها از TF توپی . این نوت بوک با استفاده از عمران نظرات مجموعه داده .


کتابخانه های مورد نیاز را نصب کنید.

!pip install -q -U pip==20.2

!pip install fairness-indicators \
  "absl-py==0.12.0" \
  "pyarrow==2.0.0" \
  "apache-beam==2.34.0" \

سایر کتابخانه های مورد نیاز را وارد کنید.

import os
import tempfile
import apache_beam as beam
from datetime import datetime
import tensorflow as tf
import tensorflow_hub as hub
import tensorflow_model_analysis as tfma
from tensorflow_model_analysis.addons.fairness.view import widget_view
from tensorflow_model_analysis.addons.fairness.post_export_metrics import fairness_indicators
from fairness_indicators import example_model
from fairness_indicators.tutorial_utils import util
مجموعه داده

در این نوت بوک، شما کار با عمران نظرات مجموعه داده که شامل حدود 2 میلیون نظر عمومی عمومی توسط ساخته شده داخلی نظرات پلت فرم در سال 2017 برای تحقیقات در حال انجام. این تلاش توسط Jigsaw، که میزبان مسابقات در Kaggle برای کمک به طبقه بندی نظرات سمی و همچنین به حداقل رساندن سوگیری مدل ناخواسته، حمایت مالی شد.

هر نظر متنی جداگانه در مجموعه داده دارای یک برچسب سمیت است که اگر نظر سمی باشد، برچسب 1 و اگر نظر غیرسمی باشد 0 است. در داده‌ها، زیرمجموعه‌ای از نظرات با انواع ویژگی‌های هویتی، از جمله دسته‌هایی برای جنسیت، گرایش جنسی، مذهب، و نژاد یا قومیت برچسب‌گذاری می‌شوند.

داده ها را آماده کنید

TensorFlow تجزیه ویژگی های از داده ها با استفاده tf.io.FixedLenFeature و tf.io.VarLenFeature . ویژگی ورودی، ویژگی خروجی و سایر ویژگی های برش مورد علاقه را ترسیم کنید.

BASE_DIR = tempfile.gettempdir()

# The input and output features of the classifier
TEXT_FEATURE = 'comment_text'
LABEL = 'toxicity'

    # input and output features
    LABEL: tf.io.FixedLenFeature([], tf.float32),
    TEXT_FEATURE: tf.io.FixedLenFeature([], tf.string),

    # slicing features
    'sexual_orientation': tf.io.VarLenFeature(tf.string),
    'gender': tf.io.VarLenFeature(tf.string),
    'religion': tf.io.VarLenFeature(tf.string),
    'race': tf.io.VarLenFeature(tf.string),
    'disability': tf.io.VarLenFeature(tf.string)

IDENTITY_TERMS = ['gender', 'sexual_orientation', 'race', 'religion', 'disability']

به طور پیش فرض، نوت بوک یک نسخه از پیش پردازش شده این مجموعه داده را دانلود می کند، اما می توانید از مجموعه داده اصلی استفاده کنید و در صورت تمایل مراحل پردازش را دوباره اجرا کنید.

در مجموعه داده اصلی، هر نظر با درصد ارزیابی‌کنندگانی که معتقد بودند یک نظر با یک هویت خاص مطابقت دارد، برچسب‌گذاری می‌شود. برای مثال، یک نظر ممکن است با موارد زیر برچسب: { male: 0.3, female: 1.0, transgender: 0.0, heterosexual: 0.8, homosexual_gay_or_lesbian: 1.0 } .

مرحله پردازش هویت را بر اساس دسته بندی (جنسیت، گرایش_جنسی و غیره) گروه بندی می کند و هویت هایی با امتیاز کمتر از 0.5 حذف می کند. بنابراین مثال بالا به صورت زیر تبدیل می‌شود: ارزیابی‌کنندگانی که معتقد بودند یک نظر با یک هویت خاص مطابقت دارد. به عنوان مثال، نظر بالا خواهد بود با موارد زیر برچسب: { gender: [female], sexual_orientation: [heterosexual, homosexual_gay_or_lesbian] }

مجموعه داده را دانلود کنید.

download_original_data = False

if download_original_data:
  train_tf_file = tf.keras.utils.get_file('train_tf.tfrecord',
  validate_tf_file = tf.keras.utils.get_file('validate_tf.tfrecord',

  # The identity terms list will be grouped together by their categories
  # (see 'IDENTITY_COLUMNS') on threshold 0.5. Only the identity term column,
  # text column and label column will be kept after processing.
  train_tf_file = util.convert_comments_data(train_tf_file)
  validate_tf_file = util.convert_comments_data(validate_tf_file)

  train_tf_file = tf.keras.utils.get_file('train_tf_processed.tfrecord',
  validate_tf_file = tf.keras.utils.get_file('validate_tf_processed.tfrecord',
Downloading data from https://storage.googleapis.com/civil_comments_dataset/train_tf_processed.tfrecord
488161280/488153424 [==============================] - 2s 0us/step
488169472/488153424 [==============================] - 2s 0us/step
Downloading data from https://storage.googleapis.com/civil_comments_dataset/validate_tf_processed.tfrecord
324943872/324941336 [==============================] - 9s 0us/step
324952064/324941336 [==============================] - 9s 0us/step

یک خط لوله تحلیل مدل TensorFlow ایجاد کنید

کتابخانه انصاف شاخص به اجرا در TensorFlow تجزیه و تحلیل مدل (TFMA) مدل . مدل‌های TFMA مدل‌های TensorFlow را با قابلیت‌های اضافی برای ارزیابی و تجسم نتایج آن‌ها می‌پوشانند. ارزیابی واقعی در داخل یک رخ می دهد خط لوله آپاچی پرتو .

مراحلی که برای ایجاد خط لوله TFMA دنبال می کنید عبارتند از:

  1. یک مدل TensorFlow بسازید
  2. یک مدل TFMA در بالای مدل TensorFlow بسازید
  3. تحلیل مدل را در یک ارکستراتور اجرا کنید. مدل نمونه در این نوت بوک از Apache Beam به عنوان ارکستراتور استفاده می کند.
def embedding_fairness_result(embedding, identity_term='gender'):

  model_dir = os.path.join(BASE_DIR, 'train',

  print("Training classifier for " + embedding)
  classifier = example_model.train_model(model_dir,

  # Create a unique path to store the results for this embedding.
  embedding_name = embedding.split('/')[-2]
  eval_result_path = os.path.join(BASE_DIR, 'eval_result', embedding_name)

  return tfma.load_eval_result(output_path=eval_result_path)

TFMA & Fairness Indicators را اجرا کنید

معیارهای شاخص های انصاف

برخی از معیارهای موجود با شاخص های انصاف عبارتند از:

جاسازی متن

TF-توپی فراهم می کند چندین درونه گیریها متن. این تعبیه‌ها به عنوان ستون ویژگی برای مدل‌های مختلف عمل می‌کنند. این آموزش از تعبیه‌های زیر استفاده می‌کند:

نتایج نشانگر انصاف

شاخص عدالت محاسبه با embedding_fairness_result خط لوله، و پس از آن ارائه نتایج در انصاف شاخص UI با ویجت widget_view.render_fairness_indicator برای همه درونه گیریها کنید.

تصادفی NNLM

eval_result_random_nnlm = embedding_fairness_result('https://tfhub.dev/google/random-nnlm-en-dim128/1')
مقایسه جاسازی ها

همچنین می توانید از Fairness Indicators برای مقایسه مستقیم جاسازی ها استفاده کنید. به عنوان مثال، مدل های تولید شده از تعبیه های NNLM و USE را مقایسه کنید.

widget_view.render_fairness_indicator(multi_eval_results={'nnlm': eval_result_nnlm, 'use': eval_result_use})
FairnessIndicatorViewer(evalName='nnlm', evalNameCompare='use', slicingMetrics=[{'sliceValue': 'Overall', 'sli…