Apuntes de la reunión del 14/07/2022 de colaboradores del TFF

  • Participantes: Krzysztof Ostrowski (Google), Boyi Chen (LinkedIn)

  • Actualización de Boyi sobre el progreso y los planes de LinkedIn.

    • Incorporado a TFF e integrado en ML infra
    • Realización de experimentos fuera de línea sobre el uso de TFF para soluciones empresariales
    • Tres áreas de interés
      • Ataques de freerider
        • Alguien quiere aportar ceros, cosechar beneficios
        • Dos objetivos: detección, soluciones
        • Modelo de envenenamiento un objetivo distinto, pero aparentemente relacionado
      • Sesgo con contribuyentes muy sesgados
        • Algunos contribuyentes tienen muchos más datos que otros.
        • Va en ambos sentidos: los usuarios pesados ​​​​influyen demasiado en el modelo, pero también muchos usuarios livianos reducen el rendimiento
      • Cross-silo FL para una combinación de datos de LinkedIn y del exterior
        • Garantías sobre la no mezcla de datos
      • Simulaciones de FL en el dispositivo
        • La capacidad de simulación ya existe: estamos hablando de simular los comportamientos observados en un entorno de producción realista.
        • Varíe las distribuciones de cosas como la potencia de procesamiento del dispositivo para evaluar cómo puede afectar el rendimiento del entrenamiento.
    • Actualmente no hay mucho progreso ejecutándose en Azure, así que apuesta por esto por ahora
  • Modos de contribuir/trabajar juntos:

    • Algoritmos y componentes en TFF para detectar freeriders y mitigarlos
      • Documento de diseño: incluya personas de ambos extremos para ayudar a mejorar
      • LinkedIn podría aportar código
      • Tentativamente LinkedIn para ser propietario o copropietario de un directorio dentro del repositorio de TFF donde podría ir esto; por determinar si uno o más de estos y adónde irían.
  • Los planes de TFF

    • Empoderar a los socios para construir plataformas basadas en TFF
      • Componentes
      • Arquitecturas de referencia
      • Tanto entre silos como entre dispositivos
        • Parte del código ya está en OSS, más código próximamente
      • Privacidad de extremo a extremo, etc., garantías para socios de plataforma
  • Próximos pasos:

    • Cree propuestas individuales para iterar con personas de ambos lados
    • Priorizar juntos
      • Tal vez eso signifique aumentar la frecuencia a una vez cada 2 semanas
      • Elija temas para desempaquetar, incluya a las personas interesadas en el tema