TensorFlow क्लाउड वर्कफ़्लोज़ को डिबग करना

अप्रत्याशित समस्याओं को ठीक करने के लिए यहां कुछ युक्तियां दी गई हैं।

वितरण रणनीति के दायरे में संचालन की अनुमति नहीं है

त्रुटि जैसे : रणनीति के दायरे में एक जनरेटर बनाना अस्वीकृत है, क्योंकि जनरेटर की प्रतिकृति बनाने के तरीके पर अस्पष्टता है (उदाहरण के लिए इसे कॉपी किया जाना चाहिए ताकि प्रत्येक प्रतिकृति को समान यादृच्छिक संख्याएं मिलें, या 'विभाजित' किया जाए ताकि प्रत्येक प्रतिकृति को अलग-अलग यादृच्छिक संख्या मिलें) संख्याएँ)।

समाधान : एपीआई run के लिए distribution_strategy='auto' पास करने से आपकी सभी स्क्रिप्ट प्रदान किए गए क्लस्टर कॉन्फ़िगरेशन के आधार पर TF वितरण रणनीति में लपेट जाती है। यदि किसी कारण से वितरण रणनीति के दायरे में किसी ऑपरेशन की अनुमति नहीं है, तो आपको उपरोक्त त्रुटि या उसके समान कुछ दिखाई देगा। त्रुटि को ठीक करने के लिए, कृपया distribution_strategy पैरामीटर में None पास करें और अपने प्रशिक्षण कोड के हिस्से के रूप में एक रणनीति उदाहरण बनाएं जैसा कि इस उदाहरण में दिखाया गया है।

डॉकर इमेज बिल्ड टाइमआउट

त्रुटि जैसे : request.exceptions.ConnectionError: ('कनेक्शन निरस्त।', टाइमआउट ('लिखने की कार्रवाई का समय समाप्त'))

समाधान : प्रवेश बिंदु के रूप में उपयोग की जा रही निर्देशिका में छवि को सफलतापूर्वक बनाने के लिए बहुत अधिक डेटा होने की संभावना है, और निर्माण में बाहरी डेटा शामिल हो सकता है। अपनी निर्देशिका संरचना को इस प्रकार पुन: स्वरूपित करें कि जिस फ़ोल्डर में प्रवेश बिंदु है उसमें केवल वर्तमान प्रोजेक्ट के लिए आवश्यक फ़ाइलें शामिल हों।

संस्करण टीपीयू प्रशिक्षण के लिए समर्थित नहीं है

त्रुटि जैसे : कार्य सबमिट करने में त्रुटि हुई। फ़ील्ड: tpu_tf_version त्रुटि: निर्दिष्ट रनटाइम संस्करण '2.3' टीपीयू प्रशिक्षण के लिए समर्थित नहीं है। कृपया कोई भिन्न रनटाइम संस्करण निर्दिष्ट करें.

समाधान : कृपया टीएफ संस्करण 2.1 का उपयोग करें। क्लस्टर और वितरण रणनीति कॉन्फ़िगरेशन अनुभाग में टीपीयू रणनीति देखें।

टीएफ रात्रिकालीन निर्माण।

चेतावनी इस प्रकार है : डॉकर मूल छवि '2.4.0.dev20200720' मौजूद नहीं है। नवीनतम टीएफ रात्रि निर्माण का उपयोग करना।

समाधान : यदि आप docker_config.parent_image पैरामीटर प्रदान नहीं करते हैं, तो डिफ़ॉल्ट रूप से हम मूल छवि के रूप में पूर्व-निर्मित TF डॉकर छवियों का उपयोग करते हैं। यदि आपके पास उस वातावरण पर टीएफ स्थापित नहीं है जहां run कहा जाता है, तो latest स्थिर रिलीज के लिए टीएफ डॉकर छवि का उपयोग किया जाएगा। अन्यथा, डॉकर छवि का संस्करण स्थानीय रूप से स्थापित टीएफ संस्करण से मेल खाएगा। हालाँकि, नवीनतम को छोड़कर, पूर्व-निर्मित TF डॉकर छवियाँ TF नाइटलीज़ के लिए उपलब्ध नहीं हैं। इसलिए, यदि आपका स्थानीय टीएफ पुराना रात्रिकालीन संस्करण है, तो हम स्वचालित रूप से नवीनतम रात्रिकालीन संस्करण में अपग्रेड कर देते हैं और इस चेतावनी को बढ़ा देते हैं।

वितरण रणनीति वस्तुओं का मिश्रण।

त्रुटि जैसे : RuntimeError: विभिन्न tf.distribute.Strategy ऑब्जेक्ट को मिलाना।

समाधान : कृपया distribution_strategy=None प्रदान करें जब आपके पास पहले से ही आपके मॉडल कोड में एक वितरण रणनीति परिभाषित हो। distribution_strategy'='auto' निर्दिष्ट करने से, आपका कोड TensorFlow वितरण रणनीति में लपेट जाएगा। यदि आपके कोड में पहले से ही कोई रणनीति ऑब्जेक्ट उपयोग किया गया है, तो यह उपरोक्त त्रुटि का कारण बनेगा।