ช่วยปกป้อง Great Barrier Reef กับ TensorFlow บน Kaggle เข้าร่วมท้าทาย

การเรียนรู้การเสริมแรง

เล่นเกมกระดานกับตัวแทน ซึ่งได้รับการฝึกฝนโดยใช้การเรียนรู้แบบเสริมกำลังและปรับใช้กับ TensorFlow Lite

เริ่ม

หากคุณเพิ่งเริ่มใช้ TensorFlow Lite และกำลังใช้งาน Android เราขอแนะนำให้คุณสำรวจแอปพลิเคชันตัวอย่างต่อไปนี้ซึ่งจะช่วยให้คุณเริ่มต้นได้

ตัวอย่าง Android

หากคุณกำลังใช้แพลตฟอร์มอื่น ๆ นอกเหนือจาก Android หรือคุณคุ้นเคยกับ APIs TensorFlow Lite คุณสามารถดาวน์โหลดรูปแบบการฝึกอบรมของเรา

ดาวน์โหลดรุ่น

มันทำงานอย่างไร

โมเดลนี้สร้างขึ้นเพื่อให้ตัวแทนเกมเล่นเกมกระดานขนาดเล็กที่เรียกว่า 'Plane Strike' สำหรับการแนะนำอย่างรวดเร็วของเกมนี้และกฎระเบียบของโปรดอ้างถึงนี้ README

ภายใต้ UI ของแอป เราได้สร้างตัวแทนที่เล่นกับผู้เล่นที่เป็นมนุษย์ เอเจนต์คือ MLP แบบ 3 ชั้นที่ใช้สถานะของบอร์ดเป็นอินพุตและส่งออกคะแนนที่คาดการณ์ไว้สำหรับแต่ละเซลล์ของบอร์ดที่เป็นไปได้ 64 เซลล์ รูปแบบการฝึกอบรมโดยใช้การไล่ระดับนโยบาย (เสริม) และคุณสามารถหารหัสการฝึกอบรม ที่นี่ หลังจากฝึกอบรมตัวแทน เราจะแปลงโมเดลเป็น TFLite และปรับใช้ในแอป Android

ระหว่างการเล่นเกมจริงในแอพ Android เมื่อถึงตาของเอเจนต์ที่จะดำเนินการ เอเจนต์จะพิจารณาสถานะกระดานของผู้เล่นที่เป็นมนุษย์ (กระดานที่อยู่ด้านล่าง) ซึ่งมีข้อมูลเกี่ยวกับการจู่โจมที่สำเร็จและไม่สำเร็จก่อนหน้านี้ และใช้แบบจำลองที่ได้รับการฝึกฝนมาเพื่อทำนายว่าจะตีที่ใดต่อไป เพื่อให้สามารถจบเกมได้ก่อนที่ผู้เล่นที่เป็นมนุษย์จะทำได้

มาตรฐานประสิทธิภาพ

หมายเลขมาตรฐานประสิทธิภาพถูกสร้างขึ้นด้วยเครื่องมือที่อธิบายไว้ ที่นี่

ชื่อรุ่น ขนาดรุ่น อุปกรณ์ ซีพียู
การไล่ระดับนโยบาย 84 Kb พิกเซล 3 (แอนดรอยด์ 10) 0.01ms*
พิกเซล 4 (แอนดรอยด์ 10) 0.01ms*

* ใช้ 1 เธรด

อินพุต

รูปแบบที่ยอมรับ 3-D float32 Tensor (1, 8, 8) เป็นของรัฐคณะกรรมการ

ผลลัพธ์

รูปแบบการส่งกลับ 2-D float32 Tensor ของรูปร่าง (1,64) เป็นคะแนนที่คาดการณ์ไว้สำหรับแต่ละตำแหน่ง 64 การนัดหยุดงานที่เป็นไปได้

ฝึกโมเดลของคุณเอง

คุณสามารถฝึกรูปแบบของคุณเองสำหรับคณะกรรมการที่มีขนาดใหญ่ / มีขนาดเล็กลงจากการเปลี่ยนแปลง BOARD_SIZE พารามิเตอร์ใน รหัสการฝึกอบรม