टीएफएफ सहयोगियों की 7/14/2022 की बैठक के नोट्स

  • प्रतिभागी: क्रिज़िस्तोफ़ ओस्ट्रोवस्की (गूगल), बोयी चेन (लिंक्डइन)

  • लिंक्डइन की प्रगति और योजनाओं पर बोयी का अपडेट।

    • TFF में ऑनबोर्ड किया गया और ML इन्फ्रा में एकीकृत किया गया
    • एंटरप्राइज़ समाधानों के लिए TFF के उपयोग पर ऑफ़लाइन प्रयोग करना
    • रुचि के तीन क्षेत्र
      • फ्रीराइडर हमले
        • कोई शून्य योगदान करना चाहता है, लाभ प्राप्त करना चाहता है
        • दो लक्ष्य - पता लगाना, समाधान
        • मॉडल विषाक्तता एक अलग लक्ष्य, लेकिन प्रतीत होता है संबंधित
      • भारी विषम योगदानकर्ताओं के साथ पूर्वाग्रह
        • कुछ योगदानकर्ताओं के पास दूसरों की तुलना में बहुत अधिक डेटा होता है
        • दोनों तरह से जाता है - भारी उपयोगकर्ता मॉडल को अधिक प्रभावित करते हैं, लेकिन बहुत से हल्के उपयोगकर्ता भी प्रदर्शन को नीचे खींचते हैं
      • लिंक्डइन और बाहर से डेटा के मिश्रण के लिए क्रॉस-साइलो FL
        • डेटा मिक्स नहीं होने की गारंटी
      • ऑन-डिवाइस FL . के सिमुलेशन
        • सिमुलेशन क्षमता पहले से मौजूद है - हम एक यथार्थवादी उत्पादन वातावरण में देखे गए व्यवहारों के अनुकरण के बारे में बात कर रहे हैं
        • डिवाइस प्रोसेसिंग पावर जैसी चीजों के अलग-अलग वितरण यह आकलन करने के लिए कि यह प्रशिक्षण प्रदर्शन को कैसे प्रभावित कर सकता है
    • वर्तमान में Azure पर बहुत अधिक प्रगति नहीं चल रही है, इसलिए अभी के लिए इस पर ध्यान दें
  • एक साथ योगदान/कार्य करने के तरीके:

    • फ्रीराइडर्स का पता लगाने और इसे कम करने के लिए TFF में एल्गोरिदम और कोइम्पोनेंट्स
      • डिज़ाइन दस्तावेज़ - दोनों छोर से लोगों में सुधार करने में मदद करने के लिए लूप
      • लिंक्डइन कोड योगदान कर सकता है
      • TFF रेपो के भीतर एक निर्देशिका के स्वामित्व या सह-स्वामित्व के लिए संभावित रूप से लिंक्डइन जहां यह जा सकता है - tbd इनमें से एक या अधिक और वे कहां जाएंगे
  • टीएफएफ की योजनाएं

    • TFF पर आधारित प्लेटफॉर्म बनाने के लिए भागीदारों को सशक्त बनाएं
      • अवयव
      • संदर्भ वास्तुकला
      • क्रॉस-साइलो और क्रॉस-डिवाइस दोनों
        • कुछ कोड पहले से ही ओएसएस में हैं, और कोड आने वाले हैं
      • एंड-टू-एंड गोपनीयता, आदि, प्लेटफ़ॉर्म भागीदारों के लिए गारंटी
  • अगले कदम:

    • दोनों पक्षों के लोगों के साथ पुनरावृति करने के लिए अलग-अलग प्रस्ताव बनाएं
    • एक साथ प्राथमिकता दें
      • हो सकता है कि इसका मतलब है कि आवृत्ति को प्रति 2 सप्ताह में एक बार बढ़ाना
      • अनपैक करने के लिए विषय चुनें, विषय में रुचि रखने वाले लोगों में लूप करें