Appunti dell'incontro del 14/07/2022 dei collaboratori del TFF

  • Partecipanti: Krzysztof Ostrowski (Google), Boyi Chen (LinkedIn)

  • L'aggiornamento di Boyi sui progressi e sui piani di LinkedIn.

    • Integrato in TFF e integrato in ML infra
    • Esecuzione di esperimenti offline sull'uso di TFF per soluzioni aziendali
    • Tre aree di interesse
      • Attacchi da freerider
        • Qualcuno vuole contribuire con zero, raccogliere benefici
        • Due obiettivi: rilevamento, soluzioni
        • Avvelenamento da modello un obiettivo distinto, ma apparentemente correlato
      • Bias con contributori fortemente distorti
        • Alcuni contributori hanno molti più dati di altri
        • Va in entrambe le direzioni: utenti pesanti che influenzano eccessivamente il modello, ma anche molti utenti leggeri che riducono le prestazioni
      • FL cross-silo per una combinazione di dati da LinkedIn e dall'esterno
        • Garanzie sulla mancata miscelazione dei dati
      • Simulazioni di FL su dispositivo
        • La capacità di simulazione esiste già: stiamo parlando di simulare i comportamenti visti in un ambiente di produzione realistico
        • Varia la distribuzione di cose come la potenza di elaborazione del dispositivo per valutare in che modo potrebbe influire sulle prestazioni di allenamento
    • Al momento non ci sono molti progressi in esecuzione su Azure, quindi punta su questo per ora
  • Modalità di contributo/lavorare insieme:

    • Algoritmi e coimponenti in TFF per rilevare i freerider e mitigarli
      • Documento di progettazione: collega le persone da entrambe le estremità per aiutare a migliorare
      • LinkedIn potrebbe contribuire con il codice
      • Provvisoriamente LinkedIn per possedere o essere co-proprietario di una directory all'interno del repository TFF dove questo potrebbe andare - da definire se uno o più di questi e dove andrebbero
  • I piani di TFF

    • Consenti ai partner di creare piattaforme basate su TFF
      • Componenti
      • Architetture di riferimento
      • Sia cross-silo che cross-device
        • Del codice è già in OSS, altro codice in arrivo
      • Privacy end-to-end, ecc., garanzie per i partner della piattaforma
  • Prossimi passi:

    • Crea proposte individuali da ripetere con persone di entrambe le parti
    • Priorità insieme
      • Forse questo significa aumentare la frequenza a una volta ogni 2 settimane
      • Scegli gli argomenti da decomprimere, inserisci le persone interessate all'argomento