Ghi chú cuộc họp cộng tác viên TFF ngày 14/7/2022

  • Người tham gia: Krzysztof Ostrowski (Google), Boyi Chen (LinkedIn)

  • Cập nhật của Boyi về tiến độ và kế hoạch của LinkedIn.

    • Được đưa vào TFF và tích hợp vào cơ sở hạ tầng ML
    • Thực hiện các thử nghiệm ngoại tuyến về việc sử dụng TFF cho các giải pháp doanh nghiệp
    • Ba lĩnh vực quan tâm
      • Các cuộc tấn công Freerider
        • Ai đó muốn đóng góp số không, gặt hái lợi ích
        • Hai mục tiêu - phát hiện, giải pháp
        • Mô hình đầu độc một mục tiêu riêng biệt, nhưng dường như có liên quan
      • Thành kiến ​​với những người đóng góp sai lệch nhiều
        • Một số cộng tác viên có nhiều dữ liệu hơn những người khác
        • Đi theo cả hai cách - người dùng nặng ảnh hưởng quá mức đến mô hình, nhưng cũng có nhiều người dùng nhẹ kéo hiệu suất xuống
      • Cross-silo FL cho hỗn hợp dữ liệu từ LinkedIn và từ bên ngoài
        • Đảm bảo về dữ liệu không trộn lẫn
      • Mô phỏng FL trên thiết bị
        • Khả năng mô phỏng đã tồn tại - chúng ta đang nói về việc mô phỏng các hành vi được thấy trong một môi trường sản xuất thực tế
        • Sự phân bổ khác nhau của những thứ như sức mạnh xử lý của thiết bị để đánh giá xem nó có thể ảnh hưởng như thế nào đến hiệu suất đào tạo
    • Hiện tại không có nhiều tiến bộ đang chạy trên Azure, vì vậy hãy cố gắng thực hiện điều này ngay bây giờ
  • Phương thức đóng góp / làm việc cùng nhau:

    • Các thuật toán và giả định trong TFF để phát hiện các Freeriders và giảm thiểu điều đó
      • Tài liệu thiết kế - vòng lặp mọi người từ cả hai phía để giúp cải thiện
      • LinkedIn có thể đóng góp mã
      • Dự kiến ​​LinkedIn để sở hữu hoặc đồng sở hữu một thư mục trong TFF repo, nơi điều này có thể đi đến - tbd cho dù một hay nhiều trong số này và chúng sẽ đi đến đâu
  • Kế hoạch của TFF

    • Trao quyền cho các đối tác xây dựng nền tảng dựa trên TFF
      • Các thành phần
      • Tham khảo kiến ​​trúc
      • Cả hai silo chéo và thiết bị chéo
        • Một số mã đã có trong OSS, sắp có thêm mã
      • Bảo mật đầu cuối, v.v., đảm bảo cho các đối tác nền tảng
  • Bước tiếp theo:

    • Tạo các đề xuất riêng lẻ để lặp lại với mọi người từ cả hai phía
    • Ưu tiên cùng nhau
      • Có thể điều đó có nghĩa là tăng tần suất lên một lần mỗi 2 tuần
      • Chọn chủ đề để giải nén, lặp lại những người quan tâm đến chủ đề đó