Tham dự Hội nghị chuyên đề Women in ML vào ngày 7 tháng 12 Đăng ký ngay

Tổng quan

Sử dụng bộ sưu tập để sắp xếp ngăn nắp các trang Lưu và phân loại nội dung dựa trên lựa chọn ưu tiên của bạn.

MinDiff là một kỹ thuật khắc phục mô hình tìm cách cân bằng hai phân phối. Trong thực tế, nó có thể được sử dụng để cân bằng tỷ lệ lỗi trên các phần khác nhau của dữ liệu của bạn bằng cách xử phạt sự khác biệt trong phân phối.

Thông thường, bạn áp dụng MinDiff khi cố gắng đảm bảo tính công bằng của nhóm, chẳng hạn như giảm thiểu sự khác biệt về tỷ lệ dương tính giả (FPR) hoặc tỷ lệ âm tính giả (FNR) giữa một phần dữ liệu thuộc lớp nhạy cảm và một phần hoạt động tốt hơn. Để thảo luận sâu hơn về các thước đo công bằng, hãy xem lại tài liệu về chủ đề này. 1 2 3

MinDiff hoạt động như thế nào?

Đưa ra hai bộ ví dụ từ bộ dữ liệu của chúng tôi, MinDiff phạt mô hình trong quá trình đào tạo vì sự khác biệt trong phân phối điểm giữa hai bộ. Hai bộ dựa trên điểm số dự đoán càng ít phân biệt, thì hình phạt sẽ được áp dụng càng nhỏ.

Hình phạt được áp dụng bằng cách thêm một thành phần vào tổn thất mà mô hình đang sử dụng để đào tạo. Nó có thể được coi là một phép đo sự khác biệt trong phân phối các dự đoán của mô hình. Khi mô hình đào tạo, nó cố gắng giảm thiểu hình phạt bằng cách đưa các phân phối lại gần nhau hơn, như được hiển thị trong biểu đồ bên dưới.

Biểu đồ so sánh MinDiff

Việc áp dụng MinDiff có thể đi kèm với sự đánh đổi đối với việc thực hiện nhiệm vụ ban đầu. MinDiff có thể hiệu quả trong khi không làm giảm hiệu suất vượt quá nhu cầu của sản phẩm, nhưng quyết định cân bằng giữa hiệu suất và hiệu quả của MinDiff nên được chủ sở hữu sản phẩm đưa ra một cách có chủ ý. Để biết ví dụ về cách triển khai MinDiff, hãy xem sổ ghi chép nghiên cứu điển hình về khắc phục hậu quả .

Tài nguyên