इस पेज का अनुवाद Cloud Translation API से किया गया है.
Switch to English

tff.simulation.TransformingClientData

GitHub पर स्रोत देखें

Transforms ग्राहक डेटा, संभावित छद्म ग्राहकों जोड़कर विस्तार।

विरासत में मिली से: ClientData

raw_client_data से प्रत्येक ग्राहक छद्म कुछ ग्राहकों के नंबर में "विस्तार" है। प्रत्येक ग्राहक आईडी मूल ग्राहक आईडी के साथ साथ एक concatenated पूर्णांक सूचकांक से मिलकर एक श्रृंखला है। उदाहरण के लिए, कच्चे क्लाइंट id "client_a" छद्म ग्राहक आईडी "client_a_0", "client_a_1" और "client_a_2" में विस्तार किया जा सकता है। एक समारोह fn (एक्स) नक्शे डाटापॉइंट एक नया डाटापॉइंट, जहां fn के निर्माता (कच्चे) client_id और सूचकांक मैं द्वारा parameterized है करने के लिए x। उदाहरण के लिए अगर एक्स एक छवि है, तो make_transform_fn ( "client_a", 0) (एक्स), पहचान हो सकती है make_transform_fn ( "client_a", 1) (एक्स) छवि का एक यादृच्छिक रोटेशन कोण के साथ द्वारा निर्धारित किया जा सकता है, जबकि है "client_a" और "1" के हैश। आमतौर पर सम्मेलन द्वारा पहचान कार्य करने के लिए सूचकांक 0 मेल खाती है, तो पहचान समर्थित है।

raw_client_data एक ClientData विस्तार करने के लिए।
make_transform_fn एक समारोह है कि रिटर्न एक प्रतिदेय कि नक्शे डाटापॉइंट एक नया डाटापॉइंट एक्स 'के लिए x। make_transform_fn make_transform_fn (raw_client_id, i) जहां मैं एक पूर्णांक सूचकांक है के रूप में बुलाया जाएगा, और एक समारोह fn (एक्स) लौटना चाहिए -> एक्स। उदाहरण के लिए अगर एक्स एक छवि है, तो make_transform_fn ( "client_a", 0) (एक्स), पहचान हो सकती है make_transform_fn ( "client_a", 1) (एक्स) छवि का एक यादृच्छिक रोटेशन कोण के साथ द्वारा निर्धारित किया जा सकता है, जबकि है "client_a" और "1" के हैश। यदि transform_fn_cons रिटर्न None , कोई परिवर्तन किया जाता है। आमतौर पर सम्मेलन द्वारा पहचान कार्य करने के लिए सूचकांक 0 मेल खाती है, तो पहचान समर्थित है।
num_transformed_clients तब्दील ग्राहकों की कुल संख्या का उत्पादन करने के लिए। यदि यह वास्तविक ग्राहकों की संख्या के एक पूर्णांक एकाधिक कश्मीर है, वहाँ बिल्कुल असली ग्राहक प्रति कश्मीर छद्म ग्राहकों, सूचकांक 0 ... कश्मीर-1 के साथ हो जाएगा। किसी भी शेष छ पहले छ असली ग्राहकों से उत्पन्न हो जाएगा और सूचकांक k दिया जाएगा।

client_ids इस डेटासेट में ग्राहकों के लिए स्ट्रिंग पहचानकर्ता की एक सूची।
dataset_computation एक tff.Computation एक ग्राहक आईडी को स्वीकार करने, एक डाटासेट लौटने।

ClientData कार्यान्वयन कि समर्थन नहीं करते dataset_computation उठाना चाहिए NotImplementedError अगर इस विशेषता पहुँचा जा सकता है।

element_type_structure ग्राहक डेटासेट के तत्व प्रकार की जानकारी।

इस में डेटासेट द्वारा दिया तत्वों ClientData वस्तु।

तरीके

create_tf_dataset_for_client

स्रोत देखें

एक नया बनाता है tf.data.Dataset ग्राहक प्रशिक्षण उदाहरण हैं।

args
client_id स्ट्रिंग वांछित ग्राहक के लिए client_id।

रिटर्न
एक tf.data.Dataset वस्तु।

create_tf_dataset_from_all_clients

स्रोत देखें

एक नया बनाता है tf.data.Dataset सभी ग्राहक उदाहरण हैं।

इस सुविधा का उपयोग प्रशिक्षण केंद्रीकृत, गैर वितरित मॉडल (NUM_CLIENTS = 1) के लिए है। यह फ़ेडरेटेड मॉडल के खिलाफ तुलना का एक बिंदु के रूप में उपयोगी हो सकता है।

वर्तमान में, कार्यान्वयन एक डाटासेट इसी क्रम में एक भी ग्राहक से सभी उदाहरण दिए गए हैं पैदा करता है, और इसलिए आम तौर पर अतिरिक्त उथल किया जाना चाहिए।

args
seed वैकल्पिक, एक बीज जिस क्रम में ग्राहकों में शामिल हो गए डेटासेट में कार्रवाई की जाती है निर्धारित करने के लिए। बीज किसी भी 32-बिट अहस्ताक्षरित पूर्णांक या इस तरह के पूर्णांक की एक सरणी हो सकता है।

रिटर्न
एक tf.data.Dataset वस्तु।

datasets

स्रोत देखें

पैदावार tf.data.Dataset यादृच्छिक क्रम में प्रत्येक ग्राहक के लिए।

इस समारोह ग्राहक डेटा की एक स्थिर सरणी के निर्माण के शीर्ष स्तर के फ़ेडरेटेड गणना करने के लिए प्रदान किया जाना उपयोग के लिए करना है।

args
limit_count वैकल्पिक, डेटासेट की अधिकतम संख्या पर लौटने के लिए।
seed वैकल्पिक, एक बीज जिस क्रम में ग्राहकों में शामिल हो गए डेटासेट में कार्रवाई की जाती है निर्धारित करने के लिए। बीज किसी भी 32-बिट अहस्ताक्षरित पूर्णांक या इस तरह के पूर्णांक की एक सरणी हो सकता है।

from_clients_and_fn

स्रोत देखें

एक निर्माणों ClientData दिया कार्य के आधार पर।

args
client_ids client_ids जो create_tf_dataset_for_client_fn को मान्य इनपुट हैं की एक गैर खाली सूची।
create_tf_dataset_for_client_fn एक समारोह है कि उपरोक्त सूची में से एक client_id लेता है, और एक रिटर्न tf.data.Dataset

रिटर्न
एक ClientData

preprocess

स्रोत देखें

लागू होता है preprocess_fn प्रत्येक ग्राहक के डेटा के लिए।

train_test_client_split

स्रोत देखें

की (ट्रेन, परीक्षण) एक जोड़ी रिटर्न ClientData

इस विधि विभाजन के ग्राहकों client_data दो भागों में ClientData के संबंध तोड़ना सेट के साथ वस्तुओं ClientData.client_ids । परीक्षा में सभी ग्राहकों को ClientData गैर खाली डेटासेट के लिए गारंटी दी जाती है, लेकिन प्रशिक्षण ClientData कोई डेटा के साथ ग्राहकों पड़ सकता है।

args
client_data आधार ClientData विभाजित करने के लिए।
num_test_clients कितने ग्राहकों के परीक्षण के लिए बाहर आयोजित करने का। यह सबसे LEN (client_data.client_ids) में किया जा सकता है - 1, के बाद से हम खाली निर्माण करने के लिए नहीं करना चाहती ClientData

रिटर्न
एक जोड़ी (train_client_data, test_client_data), जहां test_client_data है num_test_clients यादृच्छिक, बाधा के अधीन में चयनित वे प्रत्येक अपने डेटासेट में कम से कम 1 बैच की है।

जन्म देती है
ValueError यदि num_test_clients द्वारा satistifed नहीं किया जा सकता client_data , या बहुत अधिक ग्राहकों खाली डेटासेट की है।