Notas da reunião de 14/07/2022 dos colaboradores do TFF

  • Participantes: Krzysztof Ostrowski (Google), Boyi Chen (LinkedIn)

  • Atualização de Boyi sobre o progresso e os planos do LinkedIn.

    • Integrado ao TFF e integrado ao ML infra
    • Fazendo experimentos offline sobre o uso do TFF para soluções corporativas
    • Três áreas de interesse
      • Ataques de freerider
        • Alguém quer contribuir com zeros, colher benefícios
        • Dois objetivos - detecção, soluções
        • Envenenamento de modelo é um objetivo distinto, mas aparentemente relacionado
      • Viés com contribuidores fortemente distorcidos
        • Alguns contribuidores com muito mais dados do que outros
        • Vai nos dois sentidos - usuários pesados ​​​​influenciando demais o modelo, mas também muitos usuários leves arrastando o desempenho para baixo
      • FL entre silos para uma mistura de dados do LinkedIn e de fora
        • Garantias de dados que não se misturam
      • Simulações de FL no dispositivo
        • A capacidade de simulação já existe - estamos falando de simular os comportamentos vistos em um ambiente de produção realista
        • Varie as distribuições de coisas como o poder de processamento do dispositivo para avaliar como isso pode afetar o desempenho do treinamento
    • Atualmente, não há muito progresso em execução no Azure, então aposte nisso por enquanto
  • Modos de contribuir/trabalhar em conjunto:

    • Algoritmos e coimponentes em TFF para detectar freeriders e mitigar isso
      • Documento de design - faça um loop em pessoas de ambas as extremidades para ajudar a melhorar
      • LinkedIn poderia contribuir com código
      • Provisoriamente, o LinkedIn possui ou é co-proprietário de um diretório no repositório TFF para onde isso poderia ir - a determinar se um ou mais deles e para onde eles iriam
  • Os planos do TFF

    • Capacite parceiros para construir plataformas baseadas em TFF
      • Componentes
      • Arquiteturas de referências
      • Tanto entre silo quanto entre dispositivos
        • Algum código já está no OSS, mais código está por vir
      • Privacidade de ponta a ponta, etc., garantias para parceiros de plataforma
  • Próximos passos:

    • Crie propostas individuais para interagir com pessoas de ambos os lados
    • Priorizar juntos
      • Talvez isso signifique aumentar a frequência para uma vez a cada 2 semanas
      • Escolha tópicos para descompactar, faça um loop em pessoas interessadas no tópico