Colab ví dụ về chỉ số công bằng FaceSSD

Tổng quat

Trong hoạt động này, bạn sẽ sử dụng chỉ số Công bằng để khám phá những dự đoán FaceSSD trên Faces đã được gán nhãn trong tập dữ liệu hoang dã . Công bằng chỉ số là một bộ công cụ được xây dựng trên phân tích mẫu TensorFlow cho phép đánh giá thường xuyên của các số liệu công bằng trong đường ống dẫn sản phẩm.

Giới thiệu về Dataset

Trong bài tập này, bạn sẽ làm việc với tập dữ liệu dự đoán FaceSSD, khoảng 200 nghìn dự đoán hình ảnh khác nhau và xác thực cơ sở được tạo bởi API FaceSSD.

Giới thiệu về các công cụ

TensorFlow mẫu phân tích là một thư viện để đánh giá cả TensorFlow và mô hình học máy không TensorFlow. Nó cho phép người dùng đánh giá mô hình của họ trên một lượng lớn dữ liệu theo cách phân tán, tính toán trong biểu đồ và các số liệu khác trên các phần dữ liệu khác nhau và trực quan hóa trong sổ ghi chép.

TensorFlow Data Validation là một trong những công cụ mà bạn có thể sử dụng để phân tích dữ liệu của bạn. Bạn có thể sử dụng nó để tìm các vấn đề tiềm ẩn trong dữ liệu của mình, chẳng hạn như thiếu giá trị và mất cân bằng dữ liệu, có thể dẫn đến chênh lệch Công bằng.

Với chỉ số Công bằng , người dùng sẽ có thể:

  • Đánh giá hiệu suất của mô hình, chia nhỏ trên các nhóm người dùng xác định
  • Cảm thấy tự tin về kết quả với khoảng tin cậy và đánh giá ở nhiều ngưỡng

Nhập khẩu

Chạy mã sau để cài đặt thư viện fair_indicators. Gói này chứa các công cụ mà chúng tôi sẽ sử dụng trong bài tập này. Khởi động lại Thời gian chạy có thể được yêu cầu nhưng không cần thiết.

pip install -q -U pip==20.2
pip install fairness-indicators
import os
import tempfile
import apache_beam as beam
import numpy as np
import pandas as pd
from datetime import datetime

import tensorflow_hub as hub
import tensorflow as tf
import tensorflow_model_analysis as tfma
import tensorflow_data_validation as tfdv
from tensorflow_model_analysis.addons.fairness.post_export_metrics import fairness_indicators
from tensorflow_model_analysis.addons.fairness.view import widget_view
from tensorflow_model_analysis.model_agnostic_eval import model_agnostic_predict as agnostic_predict
from tensorflow_model_analysis.model_agnostic_eval import model_agnostic_evaluate_graph
from tensorflow_model_analysis.model_agnostic_eval import model_agnostic_extractor

from witwidget.notebook.visualization import WitConfigBuilder
from witwidget.notebook.visualization import WitWidget

Tải xuống và hiểu dữ liệu

Khuôn mặt dán nhãn the Wild là một tập dữ liệu chuẩn nào để xác minh khuôn mặt, hay còn gọi là khớp cặp. LFW chứa hơn 13.000 hình ảnh về các khuôn mặt được thu thập từ web.

Chúng tôi đã chạy dự đoán FaceSSD trên tập dữ liệu này để dự đoán liệu một khuôn mặt có xuất hiện trong một hình ảnh nhất định hay không. Trong Colab này, chúng tôi sẽ phân chia dữ liệu theo giới tính để quan sát xem có sự khác biệt đáng kể nào giữa hiệu suất mô hình cho các nhóm giới khác nhau hay không.

Nếu có nhiều hơn một khuôn mặt trong một hình ảnh, giới tính được gắn nhãn là "MISSING".

Chúng tôi đã lưu trữ tập dữ liệu trên Google Cloud Platform để thuận tiện. Chạy đoạn mã sau để tải xuống dữ liệu từ GCP, dữ liệu sẽ mất khoảng một phút để tải xuống và phân tích.

data_location = tf.keras.utils.get_file('', '')

stats = tfdv.generate_statistics_from_tfrecord(data_location=data_location)
Định nghĩa Hằng số

BASE_DIR = tempfile.gettempdir()

tfma_eval_result_path = os.path.join(BASE_DIR, 'tfma_eval_result')

compute_confidence_intervals = True

slice_key = 'object/groundtruth/Gender'
label_key = 'object/groundtruth/face'
prediction_key = 'object/prediction/face'

feature_map = {
    slice_key:[], tf.string, default_value=['none']),
    label_key:[], tf.float32, default_value=[0.0]),
    prediction_key:[], tf.float32, default_value=[0.0]),

Cấu hình bất khả tri mô hình cho TFMA

model_agnostic_config = agnostic_predict.ModelAgnosticConfig(

model_agnostic_extractors = [
        model_agnostic_config=model_agnostic_config, desired_batch_size=3),

Gọi lại Công bằng và Chỉ số Công bằng trong Máy tính

# Helper class for counting examples in beam PCollection
class CountExamples(beam.CombineFn):
    def __init__(self, message):
      self.message = message

    def create_accumulator(self):
      return 0

    def add_input(self, current_sum, element):
      return current_sum + 1

    def merge_accumulators(self, accumulators): 
      return sum(accumulators)

    def extract_output(self, final_sum):
      if final_sum:
        print("%s: %d"%(self.message, final_sum))
metrics_callbacks = [
      thresholds=[0.1, 0.3, 0.5, 0.7, 0.9],

eval_shared_model = tfma.types.EvalSharedModel(

with beam.Pipeline() as pipeline:
  # Read data.
  data = (
      | 'ReadData' >>

  # Count all examples.
  data_count = (
      data | 'Count number of examples' >> beam.CombineGlobally(
          CountExamples('Before filtering "Gender:MISSING"')))

  # If there are more than one face in image, the gender feature is 'MISSING'
  # and we are filtering that image out.
  def filter_missing_gender(element):
    example = tf.train.Example.FromString(element)
    if example.features.feature[slice_key].bytes_list.value[0] != b'MISSING':
      yield element

  filtered_data = (
      | 'Filter Missing Gender' >> beam.ParDo(filter_missing_gender))

  # Count after filtering "Gender:MISSING".
  filtered_data_count = (
      filtered_data | 'Count number of examples after filtering'
      >> beam.CombineGlobally(
          CountExamples('After filtering "Gender:MISSING"')))

  # Because LFW data set has always faces by default, we are adding
  # labels as 1.0 for all images.
  def add_face_groundtruth(element):
    example = tf.train.Example.FromString(element)
    example.features.feature[label_key].float_list.value[:] = [1.0]
    yield example.SerializeToString()

  final_data = (
      | 'Add Face Groundtruth' >> beam.ParDo(add_face_groundtruth))

  # Run TFMA.
  _ = (
      | 'ExtractEvaluateAndWriteResults' >>

eval_result = tfma.load_eval_result(output_path=tfma_eval_result_path)
Hiển thị các Chỉ số Công bằng

Hiển thị tiện ích Chỉ báo Công bằng với các kết quả đánh giá đã xuất.

Dưới đây, bạn sẽ thấy biểu đồ thanh hiển thị hiệu suất của từng phần dữ liệu trên các chỉ số đã chọn. Bạn có thể điều chỉnh lát so sánh đường cơ sở cũng như (các) ngưỡng được hiển thị bằng cách sử dụng menu thả xuống ở đầu hình ảnh trực quan.

Một số liệu có liên quan cho trường hợp sử dụng này là tỷ lệ dương thực sự, còn được gọi là thu hồi. Sử dụng bộ chọn ở phía bên trái để chọn biểu đồ cho true_positive_rate. Những giá trị metric phù hợp với các giá trị được hiển thị trên thẻ mô hình .

Đối với một số ảnh, giới tính được gắn nhãn là trẻ thay vì nam hoặc nữ, nếu người trong ảnh quá trẻ để có thể chú thích chính xác.

