ترجمت واجهة Cloud Translation API‏ هذه الصفحة.
Switch to English

tff.simulation.TransformingClientData

عرض المصدر على جيثب

التحويلات بيانات العملاء، ويحتمل أن تتوسع بإضافة الزائفة العملاء.

يرث من: ClientData

كل عميل من raw_client_data هو "توسيع" إلى بعض عدد من شبه العملاء. كل معرف العميل هو سلسلة تتألف من معرف العميل الأصلي بالإضافة إلى مؤشر صحيحا متصلا. على سبيل المثال، العميل معرف الخام "client_a" قد توسعت في هويات زائفة العميل "client_a_0"، "client_a_1" و "client_a_2". A FN وظيفة (خ) خرائط DATAPOINT X إلى DATAPOINT الجديد، حيث معلمات منشئ الجبهة الوطنية من قبل (الخام) CLIENT_ID ومؤشر ط. على سبيل المثال إذا كان x صورة، ثم make_transform_fn ( "client_a"، 0) (س) قد يكون الهوية، في حين make_transform_fn ( "client_a"، 1) (خ) يمكن أن يكون دوران عشوائي من الصورة مع زاوية تحددها تجزئة "client_a" و "1". عادة عن طريق اتفاقية مؤشر 0 يتوافق مع وظيفة الهوية إذا يتم اعتماد الهوية.

raw_client_data A ClientData في التوسع.
make_transform_fn وظيفة أن عائدات استدعاء أن الخرائط DATAPOINT X إلى DATAPOINT جديد س '. وسوف يطلق make_transform_fn كما make_transform_fn (raw_client_id، ط) حيث كنت هو مؤشر صحيح، ويجب أن تعود إلى الجبهة الوطنية وظيفة (خ) -> س. على سبيل المثال إذا كان x صورة، ثم make_transform_fn ( "client_a"، 0) (س) قد يكون الهوية، في حين make_transform_fn ( "client_a"، 1) (خ) يمكن أن يكون دوران عشوائي من الصورة مع زاوية تحددها تجزئة "client_a" و "1". إذا transform_fn_cons عوائد None ، فلن يتم إجراء التحول. عادة عن طريق اتفاقية مؤشر 0 يتوافق مع وظيفة الهوية إذا يتم اعتماد الهوية.
num_transformed_clients العدد الإجمالي للعملاء تحولت إلى إنتاج. إذا كان هو ك عدد صحيح متعددة من عدد من العملاء الحقيقي، سيكون هناك بالضبط ك الزائفة عملاء لكل عميل حقيقي، مع مؤشرات 0 ... ك-1. سيتم إنشاء أي تبقى ز من العملاء الأول ز الحقيقي وسوف تعطى مؤشر ك.

client_ids قائمة معرفات سلسلة للعملاء في هذه البينات.
dataset_computation A tff.Computation قبول ID العميل، والعودة مجموعة بيانات.

ClientData تطبيقات التي لا تدعم dataset_computation يجب رفع NotImplementedError إذا تم عرض محتويات هذه السمة.

element_type_structure المعلومات نوع عنصر من مجموعات البيانات العميل.

العناصر التي تم إرجاعها بواسطة مجموعات البيانات في هذا ClientData الكائن.

طرق

create_tf_dataset_for_client

أنظر المصدر

يخلق جديدة tf.data.Dataset تحتوي على أمثلة التدريب العميل.

وسائط
client_id CLIENT_ID سلسلة للعميل المرجوة.

عائدات
A tf.data.Dataset الكائن.

create_tf_dataset_from_all_clients

أنظر المصدر

يخلق جديدة tf.data.Dataset تحتوي على جميع الأمثلة العميل.

ويهدف هذا وظيفة للتدريب استخدام مركزية، نماذج غير الموزعة (NUM_CLIENTS جميعهم = 1). قد يكون هذا مفيدا كنقطة مقارنتها نماذج الاتحادية.

حاليا، وتنفيذ تنتج مجموعة البيانات التي تحتوي على كافة أمثلة من عميل واحد في النظام، ويجب أن يتم تنفيذ ذلك خلط إضافية عموما.

وسائط
seed اختياري، بذرة لتحديد الترتيب الذي تتم معالجة العملاء في مجموعة البيانات انضم. البذور يمكن أن يكون أي عدد صحيح غير موقعة 32 بت أو مجموعة من هذه الأعداد الصحيحة.

عائدات
A tf.data.Dataset الكائن.

datasets

أنظر المصدر

تعطي tf.data.Dataset لكل عميل في ترتيب عشوائي.

ويهدف هذا وظيفة للاستخدام بناء مجموعة ثابتة من بيانات العميل التي ستقدم لحساب الاتحادية على مستوى أعلى.

وسائط
limit_count اختياري، والحد الأقصى لعدد قواعد البيانات للعودة.
seed اختياري، بذرة لتحديد الترتيب الذي تتم معالجة العملاء في مجموعة البيانات انضم. البذور يمكن أن يكون أي عدد صحيح غير موقعة 32 بت أو مجموعة من هذه الأعداد الصحيحة.

from_clients_and_fn

أنظر المصدر

يبني ClientData على أساس وظيفة معينة.

وسائط
client_ids قائمة غير فارغة من client_ids التي هي مدخلات صالحة للcreate_tf_dataset_for_client_fn.
create_tf_dataset_for_client_fn وظيفة أن يأخذ CLIENT_ID من القائمة أعلاه، وإرجاع tf.data.Dataset .

عائدات
A ClientData .

preprocess

أنظر المصدر

تنطبق preprocess_fn لبيانات كل عميل.

train_test_client_split

أنظر المصدر

يعود زوج من (القطار، اختبار) ClientData .

هذه الطريقة أقسام العملاء من client_data إلى قسمين ClientData الكائنات مع مجموعات متفرقة من ClientData.client_ids . جميع العملاء في اختبار ClientData مضمونة لمجموعات البيانات غير فارغة، ولكن التدريب ClientData قد يكون عملاء مع أية بيانات.

وسائط
client_data قاعدة ClientData إلى الانقسام.
num_test_clients عدد العملاء على الصمود لاختبار. هذا يمكن أن يكون على الأكثر ليون (client_data.client_ids) - 1، لأننا لا نريد أن إنتاج فارغة ClientData .

عائدات
زوج (train_client_data، test_client_data)، حيث test_client_data تمت num_test_clients مختارة عشوائيا، مع مراعاة القيد كل منهم أن يكون على الأقل 1 دفعة في مجموعة البيانات الخاصة بهم.

يثير
ValueError إذا num_test_clients لا يمكن satistifed التي كتبها client_data ، أو الكثير من عملاء لديها قواعد بيانات فارغة.