TensorFlow Bulut İş Akışlarında Hata Ayıklama

Beklenmeyen sorunları çözmeye yönelik bazı ipuçlarını burada bulabilirsiniz.

Dağıtım stratejisi kapsamında işleme izin verilmiyor

Şuna benzer bir hata : Bir strateji kapsamı içinde bir oluşturucu oluşturmaya izin verilmez, çünkü bir oluşturucunun nasıl kopyalanacağı konusunda belirsizlik vardır (örneğin, her kopya aynı rastgele sayıları alacak şekilde kopyalanmalı mı, yoksa her kopya farklı rastgele sayılar alacak şekilde 'bölmeli mi') sayılar).

Çözüm : API'yi run için distribution_strategy='auto' iletilmesi, sağlanan küme yapılandırmasına dayalı olarak tüm komut dosyanızı bir TF dağıtım stratejisinde sarar. Herhangi bir nedenle dağıtım stratejisi kapsamında bir işleme izin verilmiyorsa, yukarıdaki hatayı veya buna benzer bir şeyi göreceksiniz. Hatayı düzeltmek için lütfen distribution_strategy parametresine None iletin ve bu örnekte gösterildiği gibi eğitim kodunuzun bir parçası olarak bir strateji örneği oluşturun.

Docker görüntüsü oluşturma zaman aşımı

Şuna benzer bir hata : request. Exceptions.ConnectionError: ('Bağlantı iptal edildi.', timeout('Yazma işlemi zaman aşımına uğradı'))

Çözüm : Giriş noktası olarak kullanılan dizinde muhtemelen görüntünün başarılı bir şekilde oluşturulabilmesi için çok fazla veri var ve derlemede gereksiz veriler bulunabilir. Dizin yapınızı, giriş noktasını içeren klasör yalnızca geçerli proje için gerekli dosyaları içerecek şekilde yeniden biçimlendirin.

Sürüm TPU eğitimi için desteklenmiyor

Şunun gibi hata : İş gönderilirken bir hata oluştu. Alan: tpu_tf_version Hata: Belirtilen çalışma zamanı sürümü '2.3', TPU eğitimi için desteklenmiyor. Lütfen farklı bir çalışma zamanı sürümü belirtin.

Çözüm : Lütfen TF 2.1 sürümünü kullanın. Küme ve dağıtım stratejisi yapılandırması bölümünde TPU Stratejisine bakın.

TF gece inşası.

Şuna benzer bir uyarı : Docker ana görüntüsü '2.4.0.dev20200720' mevcut değil. En son TF nightly yapısını kullanma.

Çözüm : docker_config.parent_image parametresini sağlamazsanız, varsayılan olarak önceden oluşturulmuş TF docker görüntülerini ana görüntü olarak kullanırız. run çağrıldığı ortamda TF yüklü değilse, latest kararlı sürüme ait TF docker görüntüsü kullanılacaktır. Aksi takdirde docker görüntüsünün sürümü, yerel olarak yüklenen TF sürümüyle eşleşecektir. Ancak, önceden oluşturulmuş TF liman işçisi görüntüleri, en yenisi dışında TF gecelikleri için mevcut değildir. Dolayısıyla, yerel TF'niz daha eski bir nightly sürümü ise, otomatik olarak en son nightly sürümüne yükseltir ve bu uyarıyı yükseltiriz.

Dağıtım stratejisi nesnelerini karıştırma.

Şöyle bir hata : RuntimeError: Farklı tf.distribute.Strategy nesneleri karıştırılıyor.

Çözüm : Model kodunuzda zaten tanımlanmış bir dağıtım stratejiniz varsa lütfen distribution_strategy=None değerini sağlayın. distribution_strategy'='auto' belirtilmesi kodunuzu bir TensorFlow dağıtım stratejisine saracaktır. Kodunuzda zaten kullanılan bir strateji nesnesi varsa, bu yukarıdaki hataya neden olacaktır.