TensorFlow Model Remediation là gì?

Nếu bạn đã xác định được mối quan tâm về tính công bằng với mô hình học máy của mình, thì có ba loại can thiệp kỹ thuật chính:

  • Đào tạo các kỹ thuật xử lý trước dữ liệu: Thu thập thêm dữ liệu, tạo dữ liệu tổng hợp, điều chỉnh trọng số của các ví dụ và tỷ lệ lấy mẫu của các lát cắt khác nhau.
  • Kỹ thuật mô hình hóa thời gian đào tạo: Thay đổi chính mô hình bằng cách giới thiệu hoặc thay đổi các mục tiêu của mô hình và thêm các ràng buộc.
  • Các kỹ thuật sau đào tạo: Sửa đổi kết quả đầu ra của mô hình hoặc giải thích kết quả đầu ra để cải thiện hiệu suất trên các chỉ số.
Thư viện TensorFlow Model Remediation cung cấp các kỹ thuật thời gian đào tạo để can thiệp vào mô hình.

Lập mô hình thời gian đào tạo

Thư viện TensorFlow Model Remediation cung cấp hai kỹ thuật để giải quyết các vấn đề thiên vị và công bằng trong mô hình của bạn, MinDiffGhép nối bản ghi phản thực (CLP) . Chúng được mô tả trong bảng dưới đây.

MinDiff CLP
Khi nào bạn nên sử dụng kỹ thuật này?

Để đảm bảo rằng một mô hình dự đoán nhãn ưu tiên tốt như nhau cho tất cả các giá trị của một thuộc tính nhạy cảm.

Để đạt được bình đẳng nhóm về cơ hội .

Để đảm bảo rằng dự đoán của mô hình không thay đổi giữa các "cặp đối lập" (trong đó thuộc tính nhạy cảm được tham chiếu trong một đối tượng địa lý là khác nhau). Ví dụ: trong bộ phân loại độc tính , các ví dụ như "Tôi là đàn ông" và "Tôi là đồng tính nữ" không được có dự đoán khác.

Để đạt được một hình thức công bằng phản thực tế.

Làm thế nào nó hoạt động? Phạt người mẫu trong quá trình đào tạo vì sự khác biệt trong phân phối điểm giữa hai nhóm. Xử phạt mô hình trong quá trình đào tạo về sự khác biệt đầu ra giữa các cặp ví dụ phản thực tế.
Phương thức đầu vào Về mặt lý thuyết, các hàm tổn hao hoạt động trên đầu ra, theo lý thuyết, bất khả tri đối với đầu vào và kiến ​​trúc mô hình. Về mặt lý thuyết, các hàm tổn hao hoạt động trên đầu ra, theo lý thuyết, bất khả tri đối với đầu vào và kiến ​​trúc mô hình.