Заметки собрания сотрудников TFF от 14 июля 2022 г.

  • Участники: Кшиштоф Островски (Google), Бойи Чен (LinkedIn).

  • Обновление Бойи о прогрессе и планах LinkedIn.

    • Адаптирован к TFF и интегрирован в инфраструктуру машинного обучения.
    • Проведение офлайн-экспериментов по использованию TFF для корпоративных решений
    • Три сферы интересов
      • Атаки фрирайдеров
        • Кто-то хочет внести нули, пожинать плоды
        • Две цели - обнаружение, решения
        • Моделируйте отравление отдельной целью, но, по-видимому, связанной
      • Предвзятость с сильно искаженными участниками
        • Некоторые участники имеют гораздо больше данных, чем другие
        • Идет в обе стороны - активные пользователи чрезмерно влияют на модель, но также и множество легковесных пользователей снижают производительность.
      • Cross-silo FL для смеси данных из LinkedIn и извне
        • Гарантии на несмешивание данных
      • Моделирование FL на устройстве
        • Возможность моделирования уже существует — мы говорим о моделировании поведения, наблюдаемого в реалистичной производственной среде.
        • Варьируйте распределение таких параметров, как вычислительная мощность устройства, чтобы оценить, как это может повлиять на эффективность обучения.
    • В настоящее время в Azure не так много прогресса, так что пока остановитесь на этом.
  • Способы участия / совместной работы:

    • Алгоритмы и компоненты в TFF для обнаружения фрирайдеров и смягчения последствий
      • Дизайн-документ: задействуйте людей с обеих сторон, чтобы помочь улучшить
      • LinkedIn может предоставить код
      • Предварительно LinkedIn может владеть или совместно владеть каталогом в репозитории TFF, где это может быть — будет определено, один или несколько из них и куда они пойдут.
  • планы ТФФ

    • Предоставьте партнерам возможность создавать платформы на основе TFF
      • Составные части
      • Справочные архитектуры
      • Как кросс-бункеры, так и кросс-девайсы
        • Некоторый код уже находится в OSS, ожидается дополнительный код
      • Полная конфиденциальность и т. д., гарантии для партнеров по платформе
  • Следующие шаги:

    • Создавайте индивидуальные предложения для повторения с людьми с обеих сторон
    • Расставляйте приоритеты вместе
      • Возможно, это означает увеличение частоты до одного раза в 2 недели.
      • Выберите темы для распаковки, подключите людей, заинтересованных в теме