Notes de la réunion du 14/07/2022 des collaborateurs de TFF

  • Participants : Krzysztof Ostrowski (Google), Boyi Chen (LinkedIn)

  • Mise à jour de Boyi sur les progrès et les plans de LinkedIn.

    • Intégré à TFF et intégré à ML infra
    • Faire des expériences hors ligne sur l'utilisation de TFF pour les solutions d'entreprise
    • Trois centres d'intérêt
      • Attaques de freeriders
        • Quelqu'un veut contribuer des zéros, récolter des bénéfices
        • Deux objectifs - détection, solutions
        • Modèle d'empoisonnement un objectif distinct, mais apparemment lié
      • Biais avec des contributeurs fortement asymétriques
        • Certains contributeurs ayant beaucoup plus de données que d'autres
        • Va dans les deux sens - les gros utilisateurs influencent trop le modèle, mais aussi beaucoup d'utilisateurs légers qui font baisser les performances
      • Cross-silo FL pour un mélange de données de LinkedIn et de l'extérieur
        • Garanties sur les données ne se mélangeant pas
      • Simulations de FL sur l'appareil
        • La capacité de simulation existe déjà - nous parlons de simuler les comportements observés dans un environnement de production réaliste
        • Variez les distributions d'éléments tels que la puissance de traitement de l'appareil pour évaluer son impact sur les performances d'entraînement
    • Actuellement, pas beaucoup de progrès en cours d'exécution sur Azure, alors lancez-vous dessus pour l'instant
  • Modes de contribution / travail en commun :

    • Algorithmes et composants dans TFF pour détecter les freeriders et atténuer cela
      • Document de conception - bouclez les personnes des deux côtés pour aider à améliorer
      • LinkedIn pourrait contribuer au code
      • Provisoirement LinkedIn pour posséder ou co-posséder un répertoire dans le référentiel TFF où cela pourrait aller - à déterminer si un ou plusieurs d'entre eux et où ils iraient
  • Les projets de TFF

    • Permettre aux partenaires de créer des plateformes basées sur la TFF
      • Composants
      • Architectures de références
      • À la fois cross-silo et cross-device
        • Une partie du code est déjà dans OSS, plus de code à venir
      • Confidentialité de bout en bout, etc., garanties pour les partenaires de la plateforme
  • Prochaines étapes:

    • Créer des propositions individuelles à itérer avec des personnes des deux côtés
    • Prioriser ensemble
      • Cela signifie peut-être augmenter la fréquence à une fois toutes les 2 semaines
      • Choisissez des sujets à décompresser, bouclez les personnes intéressées par le sujet