تصحيح أخطاء سير العمل السحابي TensorFlow

فيما يلي بعض النصائح لإصلاح المشكلات غير المتوقعة.

العملية غير مسموح بها ضمن نطاق استراتيجية التوزيع

خطأ مثل : إنشاء مولد ضمن نطاق الإستراتيجية غير مسموح به، نظرًا لوجود غموض حول كيفية تكرار المولد (على سبيل المثال، هل يجب نسخه بحيث تحصل كل نسخة متماثلة على نفس الأرقام العشوائية، أو "تقسيمه" بحيث تحصل كل نسخة متماثلة على أرقام عشوائية مختلفة أعداد).

الحل : يؤدي تمرير distribution_strategy='auto' run واجهة برمجة التطبيقات (API) إلى تغليف كافة البرامج النصية الخاصة بك في إستراتيجية توزيع TF استنادًا إلى تكوين المجموعة المقدم. سترى الخطأ أعلاه أو شيئًا مشابهًا له، إذا كان لسبب ما غير مسموح بإجراء عملية داخل نطاق استراتيجية التوزيع. لإصلاح الخطأ، يرجى تمرير None إلى معلمة distribution_strategy وإنشاء مثيل إستراتيجية كجزء من كود التدريب الخاص بك كما هو موضح في هذا المثال.

مهلة بناء صورة عامل الميناء

خطأ مثل : request.exceptions.ConnectionError: ("تم إحباط الاتصال"، مهلة ("انتهت مهلة عملية الكتابة"))

الحل : من المحتمل أن يحتوي الدليل المستخدم كنقطة إدخال على قدر كبير جدًا من البيانات التي لا يمكن إنشاء الصورة بنجاح، وقد تكون هناك بيانات غريبة مضمنة في الإنشاء. أعد تنسيق بنية الدليل بحيث يتضمن المجلد الذي يحتوي على نقطة الإدخال فقط الملفات الضرورية للمشروع الحالي.

الإصدار غير مدعوم للتدريب على مادة TPU

خطأ مثل : حدث خطأ أثناء إرسال الوظيفة. الحقل: tpu_tf_version خطأ: إصدار وقت التشغيل المحدد '2.3' غير مدعوم لتدريب TPU. الرجاء تحديد إصدار وقت تشغيل مختلف.

الحل : الرجاء استخدام TF الإصدار 2.1. راجع استراتيجية TPU في قسم تكوين استراتيجية المجموعة والتوزيع .

بناء TF ليلا.

تحذير مثل : الصورة الأصلية لـ Docker '2.4.0.dev20200720' غير موجودة. باستخدام أحدث بناء TF ليلا.

الحل : إذا لم تقم بتوفير معلمة docker_config.parent_image ، فإننا نستخدم بشكل افتراضي صور عامل الإرساء TF المضمنة مسبقًا كصورة أصلية. إذا لم يكن لديك TF مثبتًا على البيئة التي يتم فيها استدعاء run ، فسيتم استخدام صورة TF docker latest إصدار ثابت. وبخلاف ذلك، سيتطابق إصدار صورة عامل الإرساء مع إصدار TF المثبت محليًا. ومع ذلك، لا تتوفر صور عامل إرساء TF المُصممة مسبقًا لمجلات TF الليلية باستثناء الأحدث. لذلك، إذا كان TF المحلي الخاص بك هو إصدار ليلي أقدم، فإننا نقوم بالترقية إلى الإصدار الليلي الأحدث تلقائيًا ونرفع هذا التحذير.

خلط كائنات استراتيجية التوزيع.

خطأ مثل : RuntimeError: خلط كائنات tf.distribute.Strategy المختلفة.

الحل : يرجى تقديم distribution_strategy=None عندما يكون لديك بالفعل استراتيجية توزيع محددة في كود النموذج الخاص بك. سيؤدي تحديد distribution_strategy'='auto' إلى تغليف التعليمات البرمجية الخاصة بك في إستراتيجية توزيع TensorFlow. سيؤدي هذا إلى حدوث الخطأ أعلاه، إذا كان هناك كائن إستراتيجية مستخدم بالفعل في التعليمات البرمجية الخاصة بك.