Những người tham gia:
- Krzysztof Ostrowski (Google)
- Alex Ingerman (Google)
- DeWitt Clinton (Google)
- Boyi Chen (LinkedIn)
- Souvik Ghosh (LinkedIn)
- Zheng Li (LinkedIn)
[chen] Cách sử dụng hiện tại của chúng tôi, lĩnh vực quan tâm đến đóng góp, quy trình về cách đóng góp; kế hoạch phát triển trong tương lai
[boyi] Hôm nay chúng ta đang sử dụng FL như thế nào
- Hai phần - một là silo chéo
- Dữ liệu của người dùng của chúng tôi
- Các yêu cầu pháp lý hạn chế quyền truy cập vào dữ liệu
- FL tiện dụng với dữ liệu 3P
- Có thể tận dụng dữ liệu trong khi vẫn tuân thủ quy định
- FL trên thiết bị - thú vị, nhưng chủ yếu làm việc trên nhiều silo
- Một vài dự án mà chúng tôi có thể theo đuổi
- Đã được xây dựng nguyên mẫu
- TFF có ích
- Điểm chuẩn FL so với học chuyển giao được cá nhân hóa
- Sử dụng dữ liệu của khách hàng để đào tạo mô hình được cá nhân hóa cho từng khách hàng so với chuyển giao việc học f, so sánh
- Những thách thức với cách thức hoạt động của FL
- Một số khách hàng lớn hơn những khách hàng khác -> thiên vị
- Những khách hàng đóng góp nhiều nhất lo lắng về những người đi xe tự do; khách hàng có ít dữ liệu nhất lo lắng về việc không đủ ảnh hưởng đến mô hình
- Những thách thức về khả năng mở rộng
- Ngay bây giờ để suy luận (hàng trăm M)
- Dữ liệu đào tạo hiện không lớn lắm (10s-100sK / silo)
- Chạy suy luận hàng loạt trên O (hàng trăm M) máy khách
- Tổng khối lượng dữ liệu là thách thức chính
- Hồ sơ trên tất cả các khách hàng
- Kích thước cụm hiện bị giới hạn, hạn chế tỷ lệ suy luận
- Client = silo cần không để dữ liệu bị trộn lẫn với các silo khác. Cardinality là gì?
- Đang làm thí nghiệm, muốn mở rộng quy mô lên 100 nghìn silo trong tương lai
- Con số bạn đã thấy cho # khách hàng TFF là gì?
- Trên thiết bị: số lượng lớn các silo dữ liệu nhỏ; x-silo là một số lượng nhỏ các bộ dữ liệu lớn
- Các silo giống nhau như thế nào?
- Các lược đồ giống nhau, nhưng sự phân bố dữ liệu khác nhau rất nhiều trên các silo. Tham gia không bình đẳng
- [K] Bạn có đang nghĩ đến TFF để suy luận cũng như đào tạo không?
- [B] Ngay bây giờ, hãy sử dụng TFF để đào tạo; muốn đào tạo và suy luận trên cùng một khuôn khổ.
- [K] Cùng một cơ sở hạ tầng hay cùng một mô hình?
- [b} ngay bây giờ, cùng một mô hình và cùng một cụm
- [B] Muốn hiểu cách đào tạo mô hình và triển khai tới các thiết bị.
- [S] Nhu cầu đào tạo mô hình trong một môi trường, lấy ra và sử dụng trong môi trường khác là quan trọng. Chỉ với ứng dụng đầu tiên thì không.
- Hai phần - một là silo chéo
[B] Những gì chúng tôi muốn xây dựng:
- Một ý tưởng cho sự đóng góp, một khi chúng tôi thực hiện các điểm chuẩn về tính công bằng, chúng tôi có thể thêm các công cụ và điểm chuẩn vào TFF
- Cách mô hình hoạt động trên các silo (hiệu suất và độ lệch không đồng đều)
- [K] Bạn có thấy nó là vấn đề trong thực tế không? [B] Chúng tôi tin rằng nó sẽ là một vấn đề trong thực tế.
- [B] Hãy nghĩ về điều này từ góc độ đối thủ. Mọi người sẽ lo lắng về việc đưa dữ liệu vào hộp. Đó là một mối quan tâm chung nhưng chúng tôi không có một số liệu cụ thể.
- [K] Chúng ta đang giải quyết vấn đề nào? Có phải bạn đang nói về tình huống có những vấn đề cần quan tâm và thắc mắc về cách xử lý nó - nhưng nó không phải là đối thủ, bạn chỉ không muốn tạo ra sự thiên vị. Vs. một tình huống khác khi có nhiều tổ chức, các bên không tin tưởng lẫn nhau. Chúng ta đang nghĩ về một hay cả hai điều này?
- [B] Chúng tôi muốn xem xét cả hai; ngay bây giờ chỉ nghĩ về cái sau.
- [D] ví dụ: silo ở đây là các công ty và tập dữ liệu là dữ liệu được tải lên bởi mỗi
- [K] Bạn đang nêu lên những lo ngại về việc chạy tự do. Nhưng cũng có những bên không tin tưởng lẫn nhau. Các bên có muốn ngăn người khác / youy xem dữ liệu không? Những mối quan tâm này đang trong tình trạng căng thẳng. Một mặt muốn xác minh đóng góp để ngăn chặn các cuộc tấn công, mặt khác không muốn xem nội dung, vì quyền riêng tư
- [B] Hãy nhìn nhận nó theo 2 cách. Một là bảo vệ quyền riêng tư - thông qua DP, v.v. Phần khác, từ quan điểm hiệu suất mô hình, khi được đào tạo từ dữ liệu của nhiều silo, có một mối lo ngại rằng các silo khác nhau có lợi khác nhau. Chúng tôi nghĩ rằng có một cách tiêu chuẩn để tiếp cận cái trước; cái sau phức tạp hơn.
- [K] Công bằng theo nghĩa là mô hình hoạt động tốt; một trong những khác có thể được tự do. Điều thứ hai là căng thẳng hơn với quyền riêng tư. Bạn có quan tâm về nó?
- [B] Cả hai đều quan trọng như nhau. Muốn vừa bảo vệ quyền riêng tư dữ liệu vừa có cách phân phối lợi ích một cách công bằng.
- [S] Chúng tôi vẫn chưa có câu trả lời tốt. [K] Tương tự.
- [D] Mức độ tin cậy của các công ty này để vận hành điều này?
- [S] Niềm tin cho đến nay không phải là một vấn đề, ít nhất là trong các ví dụ mà tôi biết. Chúng tôi đã có một số yêu cầu ràng buộc, nhưng không có lời từ chối thẳng thừng. Mọi người sẵn sàng chia sẻ dữ liệu để chúng tôi xây dựng giá trị chung.
- [A] Bạn lo lắng về quyền riêng tư của chỉ các hầm chứa hoặc các cá nhân trong các hầm chứa?
- [S] Cái sau
- Một ý tưởng cho sự đóng góp, một khi chúng tôi thực hiện các điểm chuẩn về tính công bằng, chúng tôi có thể thêm các công cụ và điểm chuẩn vào TFF
[D] Cái này có được xây dựng trên Azure không? Những điều triển khai khác mà chúng ta cần suy nghĩ?
- [S] Cuối cùng thì GPU cũng sẽ xuất hiện; các mô hình ban đầu sẽ nhỏ hơn và có ít nhu cầu hơn. Cuối cùng, điều này sẽ liên quan đến số lượng lớn các thành viên và doanh nghiệp → các mô hình sẽ phát triển khá lớn.
- [D] Đây có phải là cùng một màu xanh được công bố rộng rãi không? Hoặc một số cơ sở hạ tầng bên trong để nhắm mục tiêu, mà bên ngoài không thể nhìn thấy được.
- [S] Đồ khá chuẩn.
- [D] Giúp cộng tác dễ dàng hơn, làm cho mã PMNM có giá trị hơn vì mọi người đều có thể chạy nó trên phương tiện công cộng.
[K] Hãy làm mọi thứ! Những gì nên được? Chúng tôi đã đề cập đến bộ tiêu chuẩn và nền tảng đa silo. WDYT về việc đưa PRD ra công chúng, nói về các tính năng và trường hợp sử dụng?
- [Z] Thông số kỹ thuật của sản phẩm trông như thế nào? Các thành phần nhỏ trong TFF?
- [k] chúng ta có thể đang nói về các thành phần hoặc một sản phẩm có thể được xây dựng dựa trên tff và có sẵn cho những người khác.
- [Z] Tôi muốn hiểu - đây có phải là quá trình đóng góp không? Bắt đầu với sản phẩm?
- [k] chúng tôi đang thực hiện quy trình ở đây. Phụ thuộc vào nơi bạn cảm thấy thoải mái.
- [Z] Bạn có ví dụ về các sản phẩm như vậy, có thể bên ngoài TFF nhưng trong TF.
- [K] TF có một quy trình cho các tài liệu thiết kế. Chúng ta có thể bắt đầu chuyển đổi những ghi chú này thành một cái gì đó tương tự. Ví dụ: silo, không tin tưởng lẫn nhau, muốn sử dụng các kỹ thuật như DP, cần phải hoạt động trên Azure
- [D] Có một danh mục các trường hợp sử dụng là hữu ích, mà không tiết lộ thông tin
- [K] Chúng tôi muốn phát triển một lộ trình, tài liệu, ví dụ về các trường hợp sử dụng sẽ tồn tại trong TFF, chúng ta có thể bắt đầu cùng nhau. Nếu bắt đầu từ quy mô nhỏ dễ dàng hơn, thì hãy làm điều này.
- [B] Tôi thấy rất nhiều nghiên cứu về những thách thức trong FL. Có lẽ chúng ta có thể sử dụng một vài công cụ để giải quyết những vấn đề này; thay đổi và bắt đầu ở đó. Ví dụ: tương tự như cưỡi tự do, dữ liệu không đồng nhất - có vẻ như thách thức phổ biến trong cài đặt liên kết. Các công cụ sẽ hữu ích trên toàn cầu.
- [K] Công cụ để đánh giá thách thức? Hoặc các thành phần của hệ thống.
- [B] Chức năng mà TFF có thể cung cấp
- [K] +1. Bắt đầu với PRD cung cấp ngữ cảnh để nói về các tính năng, nhưng chúng ta cũng có thể nói về các tính năng một cách riêng biệt. Có lẽ chúng ta có thể bắt đầu với tài liệu mô tả thách thức chạy tự do và hướng tới các công cụ để đối phó.
- [D] Chúng tôi cũng làm việc với các nhà nghiên cứu. LinkedIn có nhằm mục đích tạo ra kết quả nghiên cứu ngoài sản phẩm không?
- [Z] Trước mắt, vẫn chưa phải để nghiên cứu.
[K] Có vẻ như chúng ta có thể bắt đầu với một vài tài liệu được chia sẻ, bắt đầu mô tả một số tính năng hoặc thành phần? Một trong hai bên có thể bắt đầu. Chúng tôi có thể sử dụng tài liệu google và email. Đặt mặc định là ở chế độ công khai.
[ostrowski] Những gì chúng tôi muốn xây dựng và những bước đầu tiên cụ thể mà chúng tôi có thể thực hiện
- Nhắm đến nhiều hơn một cuộc họp khác - AI cho chính chúng ta?
- Chúng tôi đã bắt đầu mô tả một vài sản phẩm / dự án cụ thể
- Bộ điểm chuẩn
- Nền tảng cross-silo với DP, công bằng, các giao thức tải miễn phí
- Các bước tiếp theo có thể xảy ra
- Bắt đầu một tài liệu yêu cầu sản phẩm và làm rõ nó một cách công khai với nhau cho từng điều trên?
- Bắt đầu trao đổi ý tưởng cấp thiết kế?
- Kế hoạch tiềm năng cho những đóng góp phát triển thực tế?
- Các thành phần / tính năng cụ thể mà bạn muốn phát triển?
- Các hiện vật cụ thể để tạo ra:
- Tài liệu được chia sẻ mô tả vấn đề tải tự do và các yêu cầu của một công cụ hoặc tính năng trong TFF có thể giải quyết vấn đề đó
- Tài liệu được chia sẻ mô tả điểm chuẩn cho sự thiên vị trên các silo có lượng dữ liệu không bằng nhau, chúng tôi muốn điểm chuẩn để đo lường
- Tài liệu được chia sẻ xác định một thành phần mới có thể cho phép TFF hoạt động trong môi trường dựa trên Azure (TBD mà nó sẽ cần tích hợp với lớp)
[ostrowski] Giao tiếp cởi mở
- Những gì để công bố công khai (trên trang đích GitHub )
- Tóm tắt các cuộc thảo luận và quyết định từ cuộc họp này và các cuộc họp tiếp theo sẽ được cung cấp trong vòng vài ngày sau mỗi cuộc họp trên trang GitHub thứ
- Tương tự như vậy, các liên kết đến các phần mềm tạo tác (bất kỳ kế hoạch, lộ trình, tài liệu thiết kế, v.v.) sẽ được xuất bản trên GitHub
- Cuộc trò chuyện (trò chuyện?)
- Slack
- Mục tiêu chia sẻ:
- Sản phẩm / thành phần cụ thể trong phạm vi?
- Điều lệ cho một nhóm làm việc cụ thể / phạm vi hẹp hơn để hỗ trợ sự phát triển của những nhóm này?
[B] Làm gì cho các vấn đề nhỏ, hoạt động?
- [K] Sự cố về Slack hoặc GitHub có thể hoạt động. Điều gì sẽ hữu ích cho bạn?
[ostrowski] Lịch họp định kỳ mà chúng ta có thể cùng cam kết?
- Montlhy
Biên bản cuộc họp cộng tác viên TFF ngày 16/2/2022, Biên bản cuộc họp cộng tác viên TFF ngày 16/2/2022
Trừ phi có lưu ý khác, nội dung của trang này được cấp phép theo Giấy phép ghi nhận tác giả 4.0 của Creative Commons và các mẫu mã lập trình được cấp phép theo Giấy phép Apache 2.0. Để biết thông tin chi tiết, vui lòng tham khảo Chính sách trang web của Google Developers. Java là nhãn hiệu đã đăng ký của Oracle và/hoặc các đơn vị liên kết với Oracle.
Cập nhật lần gần đây nhất: 2025-07-25 UTC.
[[["Dễ hiểu","easyToUnderstand","thumb-up"],["Giúp tôi giải quyết được vấn đề","solvedMyProblem","thumb-up"],["Khác","otherUp","thumb-up"]],[["Thiếu thông tin tôi cần","missingTheInformationINeed","thumb-down"],["Quá phức tạp/quá nhiều bước","tooComplicatedTooManySteps","thumb-down"],["Đã lỗi thời","outOfDate","thumb-down"],["Vấn đề về bản dịch","translationIssue","thumb-down"],["Vấn đề về mẫu/mã","samplesCodeIssue","thumb-down"],["Khác","otherDown","thumb-down"]],["Cập nhật lần gần đây nhất: 2025-07-25 UTC."],[],[]]