Yardım Kaggle üzerinde TensorFlow ile Büyük Bariyer Resifi korumak Meydan Üyelik

Pekiştirmeli Öğrenme

Takviye öğrenimi kullanılarak eğitilmiş ve TensorFlow Lite ile konuşlandırılmış bir aracıya karşı bir masa oyunu oynayın.

Başlamak

TensorFlow Lite'ta yeniyseniz ve Android ile çalışıyorsanız, başlamanıza yardımcı olabilecek aşağıdaki örnek uygulamayı keşfetmenizi öneririz.

Android örneği

Android dışında bir platformu kullanıyorsa veya zaten aşina değilseniz TensorFlow Lite API'ler , bizim eğitimli modeli indirebilecek.

Modeli indir

Nasıl çalışır

Model, bir oyun aracısının 'Plane Strike' adlı küçük bir tahta oyunu oynaması için yapılmıştır. Bu oyun ve kuralları hızlı bir giriş için, bu başvurun README .

Uygulamanın kullanıcı arayüzünün altında, insan oyuncuya karşı oynayan bir ajan oluşturduk. Aracı, kart durumunu girdi olarak alan ve 64 olası kart hücresinin her biri için tahmin edilen puanı veren 3 katmanlı bir MLP'dir. Model politikası gradyan (PEKİŞTİRMEK) kullanılarak denetlenen ve eğitim kodunu bulabilirsiniz burada . Aracıyı eğittikten sonra modeli TFLite'a dönüştürüyoruz ve Android uygulamasında dağıtıyoruz.

Android uygulamasındaki gerçek oyun sırasında, temsilcinin harekete geçme sırası geldiğinde, temsilci, önceki başarılı ve başarısız vuruşlar (isabetler ve ıskalar) hakkında bilgi içeren insan oyuncunun tahta durumuna (alttaki tahta) bakar. , ve insan oyuncu bitirmeden oyunu bitirebilmesi için bir sonraki vuracağı yeri tahmin etmek için eğitilmiş modeli kullanır.

Performans karşılaştırmaları

Performans kriter numaraları açıklanan aracıyla oluşturulan burada .

Model adı Model boyutu cihaz İşlemci
İlke Gradyanı 84 Kb Piksel 3 (Android 10) 0.01 ms*
Piksel 4 (Android 10) 0.01 ms*

* 1 konu kullanıldı.

Girişler

Model 3 boyutlu kabul float32 kartı durum olarak (1, 8, 8) tensör.

çıktılar

Model 2-B döner float32 64 olası çarpma pozisyonları her biri için tahmini puan olarak şekil tensör (1,64).

Kendi modelinizi eğitin

Sen değişiklikten daha büyük / küçük tahta için kendi modelini eğitebilir BOARD_SIZE parametreyi eğitim kod .