2022년 8월 11일 TFF 협력자 회의 메모

  • 제안된 의제 주제: Jeremy Lewi는 구축할 수 있는 새로운 구성 요소에 대한 TFF 기반 아이디어를 발표합니다.
  • [JL] 단순 연합 분석 시나리오에 중점을 두고 TFF를 Google 시트와 연결하여 단순 연합 평균을 수행합니다. Kubernetes에서 작업하고 시트에서 읽기
  • [JL] 한 가지 문제는 현재 작업자가 진입 지점이 있어야 한다는 것입니다.
    • 그렇지 않은 경우가 많으므로 작업자가 서버를 호출하는 반대 방향으로 연결을 설정할 수 있도록 하는 전송 계층이 필요합니다.
    • 이러한 구성 요소는 현재 생태계에 없습니다.
  • [BC] 또한 이것의 필요성을 보았습니다. 현재 제한된 방식으로 TFF를 사용하고 있으며 클라이언트가 데이터를 업로드하는 사내 클라우드입니다. 그러나 다중 데이터 센터 설정으로 마이그레이션하려면 위에서 설명한 JL과 같은 것이 필요합니다.
  • [JL] 작업자가 기존 런타임을 대체해야 하는 서버의 대기열에서 작업 항목을 "끌어올" 수 있게 하는 계층을 생각하고 있습니다.
  • [KO] 이것을 "교체"의 관점에서 생각할 필요가 없습니다. 계산 작성 및 런타임의 98%를 동일하게 유지할 수 있으며 대신 제안한 방식으로 작동하는 새 구성 요소로 교체하면 됩니다. 실행기 요청을 하향식으로 릴레이하기 위한 메커니즘으로 원격 실행기를 끕니다.
  • [BC] 동기화가 필요합니까, 아니면 기존 동기화 패러다임 내에서 작동합니까?
  • [BC] 또한 기존 플랫폼 중 일부는 "작업 대기열" 접근 방식을 사용하므로 이는 확립된 아이디어처럼 들립니다.
  • [BC] 타임아웃을 도입하는 것은 (느린 작업자나 낙오자를 다루기 위해) 격차를 해소하는 데에도 도움이 될 것입니다.
  • [KO] 동기 대 비동기와 관련하여 TFF에는 "코호트"라는 개념이 필요한 집합적 추상화가 있습니다. 따라서 일부 클라이언트가 함께 "집단"에 합류하기로 결정하고 서버가 이를 조정하는 역할을 해야 할 필요가 있습니다. 이 작업이 완료되면 개별 실행기 요청이 클라이언트에 전달되는 방식이 달라질 수 있습니다. 하향식을 호출하는 원격 실행기는 이에 대한 한 가지 방법이지만 유일한 방법은 아닙니다. 위에서 제안한 것과 같은 작업 항목 기반의 커뮤니케이션 패턴도 이 구조에 확실히 들어맞을 수 있습니다. 누군가 초안을 작성하기 위한 작은 1-2 페이지 제안을 위한 자료처럼 보입니까?
  • [JL] 우리 모두가 반복할 수 있는 새로운 구성 요소에 대한 제안을 작성하는 자원 봉사.
  • [JL] BTW, 관련 기능이 있는 다른 인접 저장소가 있습니까?
  • [KO] 참고로 https://github.com/google/federated-compute Google에서도 제공하지만 대부분 모바일 시나리오에 초점을 맞추고 있으며 현재 TFF에 연결되어 있지 않으며 현재 사용 중인 기능이 포함되어 있지 않습니다. 여기에서 설명하므로 이 그룹에서 작은 제안을 시도하고 공식화하는 것이 좋습니다.
  • [BD] 해결해야 할 몇 가지 질문: 캐싱 결과, 집계 시기.
  • [Hao] 비동기가 아닌 경우 이 시나리오에서 캐싱이 필요하지 않을 수 있습니다.
  • [KO] 간단한 MapReduce 패턴에 맞는 시나리오의 경우 TFF에서 일부 지원이 있습니다( https://www.tensorflow.org/federated/api _docs/python/tff/backends/mapreduce 참조). 이 라이브러리를 사용하면 TFF 계산을 더 간단한 플랫폼에서 실행할 수 있는 MapReduce와 유사한 형식으로 변환할 수 있습니다. 그러나 표현력에 약간의 손실이 있으며 sevrr과 클라이언트 간에 여러 차례의 왕복 통신이 필요한 이전에 논의된 아이디어 중 일부는 이 프레임워크에서 표현할 수 없습니다. 그리고 교차 사일로 설정은 오래 지속되는 연결을 유지할 수 있는 잘 프로비저닝된 클라이언트(사일로) 그룹을 다루고 있기 때문에 이러한 유형의 아이디어를 고유하게 가능하게 합니다.
  • [Hao] 집단 작전은 어떻습니까, allreduce - 지원되거나 호환됩니까?
  • [KO] 현재 없습니다. Allreduce는 단일 공급 평균 시나리오에서 활용할 수 있지만 처리 라운드 사이에 서버에서 작업이 발생하지 않는다고 가정한다는 점에서 다소 제한적으로 사용됩니다. 더 일반적인 경우에는 작동하지 않습니다. 그러나 효율적인 브로드캐스팅 모드와 효율적인 집계 모드(하드웨어 가속 포함)의 두 가지를 갖는 것은 TFF에서 활용할 수 있는 것입니다.
  • [KO] JL이 새 구성 요소에 대한 제안 초안을 시작하려고 하고 다른 사람들이 거기에 무엇이 있어야 하는지에 대한 의견이 있는 것처럼 들립니다. 협력합시다(방의 모든 사람 중 +1). 논의할 초안을 가지고 2주 후에 다시 소집할 예정입니다.