Trả lời cho sự kiện TensorFlow Everywhere tại địa phương của bạn ngay hôm nay!
Trang này được dịch bởi Cloud Translation API.
Switch to English

Mô hình Remediation là gì?

Sau khi thực hiện đánh giá từng phần về hiệu suất của mô hình học máy, bạn có thể nhận thấy rằng mô hình của mình hoạt động kém hiệu quả trên một số phần dữ liệu nhất định. Loại hiệu suất không đồng đều này đôi khi có thể dẫn đến kết quả không công bằng và có khả năng gây hại cho các nhóm dân số dễ bị tổn thương. Nói chung, có ba loại can thiệp kỹ thuật chính để giải quyết các lo ngại về sự sai lệch:

  • Thay đổi dữ liệu đầu vào: Thu thập thêm dữ liệu, tạo dữ liệu tổng hợp, điều chỉnh trọng số và tốc độ lấy mẫu của các lát khác nhau, v.v. 1
  • Can thiệp vào mô hình: Thay đổi chính mô hình bằng cách giới thiệu hoặc thay đổi các mục tiêu của mô hình, thêm các ràng buộc, v.v. 2
  • Hậu xử lý kết quả: Sửa đổi kết quả đầu ra của mô hình hoặc giải thích kết quả đầu ra để cải thiện hiệu suất trên các chỉ số. 3

from tensorflow_model_remediation import min_diff
import tensorflow as tf

# Start by defining a Keras model.
original_model = ...

# Set the MinDiff weight and choose a loss.
min_diff_loss = min_diff.losses.MMDLoss()
min_diff_weight = 1.0  # Hyperparamater to be tuned.

# Create a MinDiff model.
min_diff_model = min_diff.keras.MinDiffModel(
original_model, min_diff_loss, min_diff_weight)

# Compile the MinDiff model normally.
min_diff_model.compile(...)

# Create a MinDiff Dataset and train the min_diff_model.
min_diff_model.fit(min_diff_dataset, ...)

MinDiff là gì?

MinDiff là một kỹ thuật khắc phục mô hình tìm cách cân bằng hai phân phối. Trong thực tế, nó có thể được sử dụng để cân bằng tỷ lệ lỗi trên các phần khác nhau của dữ liệu của bạn bằng cách xử phạt sự khác biệt trong phân phối.

Thông thường, người ta áp dụng MinDiff khi cố gắng giảm thiểu sự khác biệt về tỷ lệ dương tính giả (FPR) hoặc tỷ lệ âm tính giả (FNR) giữa một phần dữ liệu thuộc lớp nhạy cảm và một phần hoạt động tốt hơn. Để thảo luận sâu hơn về các thước đo công bằng, hãy xem lại tài liệu về chủ đề này. 4 5 6

MinDiff hoạt động như thế nào?

Đưa ra hai bộ ví dụ từ bộ dữ liệu của chúng tôi, MinDiff phạt mô hình trong quá trình đào tạo vì sự khác biệt trong phân phối điểm giữa hai bộ. Hai bộ dựa trên điểm số dự đoán càng ít phân biệt, thì hình phạt sẽ được áp dụng càng nhỏ.

Hình phạt được áp dụng bằng cách thêm một thành phần vào tổn thất mà mô hình đang đào tạo. Nó có thể được coi như một phép đo sự khác biệt trong phân phối các dự đoán của mô hình. Khi mô hình đào tạo, nó sẽ cố gắng giảm thiểu hình phạt bằng cách đưa các phân phối lại gần nhau hơn, như trong biểu đồ trên.

Việc áp dụng MinDiff có thể đi kèm với sự đánh đổi đối với việc thực hiện nhiệm vụ ban đầu. Trong thực tế, chúng tôi thường thấy MinDiff có hiệu quả trong khi không làm giảm hiệu suất vượt quá nhu cầu của sản phẩm, nhưng điều này sẽ phụ thuộc vào ứng dụng và quyết định nên được chủ sở hữu sản phẩm đưa ra có chủ ý. Để biết các ví dụ về cách triển khai MinDiff, hãy xem hướng dẫn sổ tay của chúng tôi .

1 Zhang, G., Bai, B., Zhang, J., Bai, K., Zhu, C., Zhao, T. (2020). Nhân khẩu học không nên là lý do độc hại: Giảm thiểu sự phân biệt đối xử trong các phân loại văn bản với Trọng số phiên bản.
2 Prost, F., Qian H., Chen, Q., Chi, E., Chen, J., Beutel, A. (2019). Hướng tới sự cân bằng tốt hơn giữa hiệu suất và sự công bằng với kết hợp phân phối dựa trên hạt nhân.
3 Alabdulmohsin, I. (2020). Phân loại Công bằng thông qua Tối ưu hóa Không giới hạn.
4 Dwork, C., Hardt, M., Pitassi, T., Reingold, O., Zemel, R. (2011). Công bằng thông qua nhận thức.
5 Hardt, M., Price, E., Srebro, N. (2016). Bình đẳng về Cơ hội trong Học tập có Giám sát.
6 Chouldechova, A. (2016). Dự đoán công bằng với tác động khác nhau: Nghiên cứu về sự thiên vị trong các công cụ dự đoán tái phạm.

Tài nguyên