TFF सहयोगियों की 8/11/2022 बैठक के नोट्स

  • प्रस्तावित एजेंडा विषय: जेरेमी लेवी नए घटकों के लिए अपने टीएफएफ-आधारित विचार प्रस्तुत करेंगे जिन्हें बनाया जा सकता है
  • [जेएल] साधारण फ़ेडरेटेड एनेलिटिक्स परिदृश्यों पर ध्यान केंद्रित करते हुए, TFF को Google शीट से जोड़कर साधारण फ़ेड एवरेजिंग करने के लिए। कुबेरनेट्स में काम करना, चादरों से पढ़ना।
  • [जेएल] एक चुनौती यह है कि वर्तमान में श्रमिकों के पास प्रवेश बिंदु होना आवश्यक है।
    • अक्सर ऐसा नहीं होता है, इसलिए एक ट्रांसपोर्ट लेयर की आवश्यकता होती है जो विपरीत दिशा में कनेक्टिविटी स्थापित करने में सक्षम बनाता है, एक सर्वर को कॉल करने वाले कर्मचारी।
    • ऐसा घटक वर्तमान में पारिस्थितिकी तंत्र में नहीं है।
  • [ईसा पूर्व] इसकी आवश्यकता भी देखी। वर्तमान में सीमित फैशन में TFF का उपयोग करते हुए, इन-हाउस क्लाउड जहां क्लाइंट डेटा अपलोड करते हैं। लेकिन, मल्टी-डेटासेंटर सेटिंग में माइग्रेट करने के लिए ऊपर वर्णित JL जैसी किसी चीज़ की आवश्यकता होगी।
  • [जेएल] एक ऐसी परत के बारे में सोचना जो श्रमिकों को सर्वर पर एक कतार से काम की वस्तुओं को "खींचने" में सक्षम बनाती है - क्या इसे मौजूदा रनटाइम को बदलना चाहिए।
  • [केओ] "प्रतिस्थापन" के संदर्भ में इसके बारे में सोचने की ज़रूरत नहीं है - आप गणना संलेखन और रनटाइम के 98% को समान रख सकते हैं, और आप बस नए घटक में स्वैप करेंगे जो आपके द्वारा प्रस्तावित तरीके से काम करता है। निष्पादक अनुरोधों को ऊपर नीचे करने के लिए एक तंत्र के रूप में दूरस्थ निष्पादक को बंद करें।
  • [बीसी] क्या आपको इसे एसिंक्स होने की आवश्यकता होगी, या यह मौजूदा सिंक प्रतिमान के भीतर काम करेगा।
  • [बीसी] इसके अलावा, कुछ बाहर निकलने वाले प्लेटफॉर्म "कार्यों की कतार" दृष्टिकोण का उपयोग करते हैं, इसलिए यह एक स्थापित विचार की तरह लगता है।
  • [ईसा पूर्व] टाइमआउट पेश करने से शायद अंतर को पाटने में मदद मिलेगी (धीमी गति से काम करने वालों या स्ट्रगलरों से निपटने के लिए)।
  • [KO] सिंक बनाम async के संबंध में, हमारे पास TFF में सामूहिक एब्स्ट्रैक्शन हैं जिनके लिए "कोहोर्ट" की धारणा की आवश्यकता होती है। जैसे, एक समय ऐसा होना चाहिए जब वहाँ के कुछ ग्राहक एक साथ मिलकर एक "समूह" में शामिल होने का निर्णय लें, और सर्वर को ऐसा होने के लिए ऑर्केस्ट्रेट करने में एक भूमिका निभाने की आवश्यकता होगी। जब तक यह किया जाता है, जिस तरह से अलग-अलग निष्पादक अनुरोध क्लाइंट को रिले किए जाते हैं, वे भिन्न हो सकते हैं। रिमोट एक्ज़ीक्यूटर जो टॉप-डाउन कॉल करता है, वह इसके बारे में जाने का एक तरीका है, लेकिन केवल एक ही नहीं है; एक कार्य आइटम-आधारित संचार पैटर्न जैसा कि ऊपर प्रस्तावित किया गया था, निश्चित रूप से इस संरचना में फिट हो सकता है। किसी के मसौदे के लिए एक छोटे से एक-दो पेजर प्रस्ताव के लिए सामग्री की तरह लगता है?
  • [जेएल] हम सभी के लिए पुनरावृति करने के लिए एक नए घटक के लिए एक प्रस्ताव लिखने के लिए स्वेच्छा से।
  • [जेएल] बीटीडब्ल्यू, क्या संबंधित कार्यक्षमता के साथ अन्य आसन्न रेपो हैं?
  • [KO] FYI करें, Google से भी https://github.com/google/federated-compute , लेकिन यह ज्यादातर मोबाइल परिदृश्य पर ध्यान केंद्रित कर रहा है, यह इस बिंदु पर TFF से कनेक्ट नहीं है, और इसमें आपकी कार्यक्षमता शामिल नहीं है यहाँ वर्णन कर रहे हैं, इसलिए इस समूह में एक छोटा सा प्रस्ताव तैयार करने का प्रयास करना निश्चित रूप से समझ में आता है।
  • [बीडी] संबोधित करने के लिए कुछ प्रश्न: कैशिंग परिणाम, कब एकत्र करना है।
  • [हाओ] शायद इस परिदृश्य में कैशिंग की आवश्यकता नहीं है अगर यह async नहीं है
  • [KO] ऐसे परिदृश्यों के लिए जो एक साधारण MapReduce पैटर्न में फिट होते हैं, हमारे पास TFF में कुछ समर्थन है, https://www.tensorflow.org/federated/api _docs/python/tff/backends/mapreduce देखें। यह पुस्तकालय आपको TFF संगणनाओं को एक MapReduce-जैसे रूप में अनुवाद करने में सक्षम बनाता है जिसे आप एक सरल मंच पर निष्पादित कर सकते हैं। हालांकि, अभिव्यक्ति में कुछ कमी है, और पहले चर्चा की गई कुछ विचारों के लिए सेवर और क्लाइंट के बीच आगे और पीछे संचार के कई दौर की आवश्यकता इस ढांचे में व्यक्त नहीं होगी। और, क्रॉस-साइलो सेटिंग विशिष्ट रूप से उन प्रकार के विचारों को संभव बनाती है, क्योंकि हम अच्छी तरह से प्रावधान किए गए ग्राहकों (साइलो) के समूहों के साथ काम कर रहे हैं जो लंबे समय तक चलने वाले कनेक्शन बनाए रख सकते हैं।
  • [हाओ] सामूहिक ऑप्स के बारे में क्या, सभी कम करें - क्या वे समर्थित या संगत हैं
  • [केओ] वर्तमान में नहीं। Allreduce का कुछ हद तक सीमित उपयोग होगा, जबकि इसे एकल फेड औसत परिदृश्य में लीवरेज किया जा सकता है, यह मानता है कि प्रसंस्करण के दौर के बीच सर्वर पर कोई काम नहीं हो रहा है। अधिक सामान्य मामलों में काम नहीं करेगा। लेकिन, इसके दो हिस्सों का होना - प्रसारण का कुशल तरीका और एकत्रीकरण का कुशल तरीका, शायद हार्डवेयर त्वरण के साथ भी, कुछ ऐसा होगा जिसका हम TFF में लाभ उठा सकते हैं।
  • [KO] ऐसा लगता है कि JL एक नए घटक के प्रस्ताव के मसौदे को शुरू करने के लिए तैयार है, और दूसरों की राय है कि इसमें क्या होना चाहिए - आइए सहयोग करें (कमरे में सभी से +1)। संभवत: चर्चा के लिए मसौदे के साथ 2 सप्ताह में पुन: बुलाना।