2022 年 7 月 14 日 TFF 协作者会议笔记

  • 参与者:Krzysztof Ostrowski (Google),Boyi Chen (LinkedIn)

  • Boyi 对 LinkedIn 的进展和计划的更新。

    • 加入 TFF 并集成到 ML 基础架构
    • 在企业解决方案中使用 TFF 进行离线实验
    • 三个目标领域
      • 搭便车攻击
        • 有人既不想做贡献,又想攫取收益
        • 两个目标 - 检测,解决方案
        • 模型中毒的目标不同,但似乎有关联
      • 对严重倾斜的贡献者的偏见
        • 一些贡献者拥有比其他贡献者多得多的数据
        • 这是双向的 - 重量级用户对模型的影响过大,但也有大量轻量级用户拖累性能
      • 跨数据孤岛联合学习,用于混合来自 LinkedIn 和外部的数据
        • 保证数据不混合
      • 模拟设备端联合学习
        • 模拟能力已经存在 - 我们谈的是模拟在现实生产环境中看到的行为
        • 改变设备处理能力等内容的分布,以评估它如何影响训练性能
    • 目前在 Azure 上运行的进展不大,所以暂时不考虑这个问题
  • 贡献/合作模式:

    • TFF 中用于检测搭便车者并缓解这种情况的算法和组件
      • 设计文档 - 两端人员循环以帮助改进
      • LinkedIn 可以贡献代码
      • 暂定 LinkedIn 在项目的 TFF 仓库内拥有或共同拥有一个目录 - 一个或多个目录以及目录权限待定
  • TFF 的计划

    • 赋能合作伙伴搭建基于 TFF 的平台
      • 组件
      • 参考架构
      • 跨数据孤岛和跨设备
        • 一些代码已经在 OSS 中,更多代码即将发布
      • 端到端隐私等,为平台合作伙伴提供保障
  • 后续步骤:

    • 创建单独的提案以与双方人员进行迭代
    • 一起确定优先级
      • 这也许意味着将频率增加到每 2 周一次
      • 选择要展开的主题,循环访问对该主题感兴趣的人