สร้างโมเดล TensorFlow Lite

หน้านี้ให้คำแนะนำสำหรับการสร้างแบบจำลอง TensorFlow ของคุณด้วยความตั้งใจที่จะแปลงเป็นรูปแบบโมเดล TensorFlow Lite โมเดลแมชชีนเลิร์นนิง (ML) ที่คุณใช้กับ TensorFlow Lite นั้นถูกสร้างขึ้นและฝึกฝนโดยใช้ไลบรารีและเครื่องมือหลักของ TensorFlow เมื่อคุณสร้างโมเดลด้วยแกน TensorFlow แล้ว คุณสามารถแปลงเป็นรูปแบบโมเดล ML ที่เล็กลงและมีประสิทธิภาพมากขึ้น ซึ่งเรียกว่าโมเดล TensorFlow Lite

การสร้างแบบจำลองของคุณ

หากคุณกำลังสร้างโมเดลแบบกำหนดเองสำหรับกรณีการใช้งานเฉพาะของคุณ คุณควรเริ่มต้นด้วยการพัฒนาและฝึกอบรมโมเดล TensorFlow หรือขยายโมเดลที่มีอยู่

ข้อจำกัดในการออกแบบโมเดล

ก่อนที่คุณจะเริ่มกระบวนการพัฒนาแบบจำลองของคุณ คุณควรตระหนักถึงข้อจำกัดสำหรับรุ่น TensorFlow Lite และสร้างแบบจำลองของคุณโดยคำนึงถึงข้อจำกัดเหล่านี้:

  • ความสามารถในการประมวลผลที่จำกัด - เมื่อเทียบกับเซิร์ฟเวอร์ที่มีอุปกรณ์ครบครันซึ่งมี CPU หลายตัว ความจุหน่วยความจำสูงและโปรเซสเซอร์เฉพาะทาง เช่น GPU และ TPU อุปกรณ์พกพาและอุปกรณ์ Edge นั้นมีข้อจำกัดมากกว่ามาก ในขณะที่กำลังประมวลผลและความเข้ากันได้ของฮาร์ดแวร์เฉพาะกำลังเติบโตขึ้น แต่โมเดลและข้อมูลที่คุณสามารถประมวลผลได้อย่างมีประสิทธิภาพยังคงมีจำกัด
  • ขนาดของโมเดล - ความซับซ้อนโดยรวมของโมเดล รวมถึงตรรกะการประมวลผลข้อมูลล่วงหน้าและจำนวนเลเยอร์ในโมเดล จะเพิ่มขนาดในหน่วยความจำของโมเดล รุ่นใหญ่อาจทำงานช้าจนไม่สามารถยอมรับได้หรืออาจไม่พอดีกับหน่วยความจำที่มีอยู่ของอุปกรณ์พกพาหรืออุปกรณ์ Edge
  • ขนาดของข้อมูล - ขนาดของข้อมูลที่ป้อนเข้าที่สามารถประมวลผลอย่างมีประสิทธิภาพด้วยโมเดลการเรียนรู้ของเครื่องนั้นถูกจำกัดบนอุปกรณ์พกพาหรืออุปกรณ์ Edge โมเดลที่ใช้ไลบรารีข้อมูลขนาดใหญ่ เช่น ไลบรารีภาษา ไลบรารีรูปภาพ หรือไลบรารีคลิปวิดีโอ อาจไม่พอดีกับอุปกรณ์เหล่านี้ และอาจต้องใช้โซลูชันการจัดเก็บและการเข้าถึงจากอุปกรณ์ภายนอก
  • การทำงานของ TensorFlow ที่รองรับ - สภาพแวดล้อมรันไทม์ TensorFlow Lite รองรับชุดย่อยของการดำเนินการโมเดลการเรียนรู้ของเครื่องเมื่อเทียบกับรุ่น TensorFlow ปกติ ในขณะที่คุณพัฒนาโมเดลสำหรับใช้กับ TensorFlow Lite คุณควรติดตามความเข้ากันได้ของโมเดลของคุณกับความสามารถของสภาพแวดล้อมรันไทม์ TensorFlow Lite

สำหรับข้อมูลเพิ่มเติมในการสร้างโมเดลที่มีประสิทธิภาพ เข้ากันได้ และมีประสิทธิภาพสูงสำหรับ TensorFlow Lite โปรดดู ที่ แนวทางปฏิบัติที่ดีที่สุด ด้านประสิทธิภาพ

การพัฒนาแบบจำลอง

ในการสร้างโมเดล TensorFlow Lite ก่อนอื่นคุณต้องสร้างโมเดลโดยใช้ไลบรารีหลักของ TensorFlow ไลบรารีหลักของ TensorFlow คือไลบรารีระดับล่างที่มี API เพื่อสร้าง ฝึกฝน และปรับใช้โมเดล ML

เวิร์กโฟลว์การสร้าง TFLite

TensorFlow มีสองเส้นทางสำหรับการทำเช่นนี้ คุณสามารถพัฒนาโค้ดโมเดลที่กำหนดเองได้ หรือเริ่มต้นด้วยการนำโมเดลไปใช้ใน TensorFlow Model Garden

สวนจำลอง

TensorFlow Model Garden มีการนำโมเดลแมชชีนเลิร์นนิง (ML) อันล้ำสมัยมาใช้งานสำหรับการมองเห็นและการประมวลผลภาษาธรรมชาติ (NLP) คุณยังจะพบเครื่องมือเวิร์กโฟลว์ที่ช่วยให้คุณกำหนดค่าและเรียกใช้โมเดลเหล่านั้นบนชุดข้อมูลมาตรฐานได้อย่างรวดเร็ว โมเดลแมชชีนเลิร์นนิงใน Model Garden มีโค้ดแบบเต็มเพื่อให้คุณสามารถทดสอบ ฝึก หรือฝึกซ้ำได้โดยใช้ชุดข้อมูลของคุณเอง

ไม่ว่าคุณกำลังมองหาการเปรียบเทียบประสิทธิภาพสำหรับโมเดลที่มีชื่อเสียง ตรวจสอบผลการวิจัยที่เพิ่งเปิดตัว หรือขยายโมเดลที่มีอยู่ Model Garden สามารถช่วยคุณบรรลุเป้าหมาย ML ของคุณ

โมเดลที่กำหนดเอง

หากกรณีการใช้งานของคุณอยู่นอกเหนือที่รองรับโดยโมเดลใน Model Garden คุณสามารถใช้ไลบรารีระดับสูง เช่น Keras เพื่อพัฒนาโค้ดการฝึกแบบกำหนดเองของคุณได้ หากต้องการเรียนรู้พื้นฐานของ TensorFlow โปรดดู คู่มือ TensorFlow ในการเริ่มต้นใช้งานตัวอย่าง โปรดดู ภาพรวมบทช่วยสอนของ TensorFlow ซึ่งมีคำแนะนำในการเริ่มต้นบทเรียนระดับผู้เชี่ยวชาญ

การประเมินแบบจำลอง

เมื่อคุณพัฒนาโมเดลของคุณแล้ว คุณควรประเมินประสิทธิภาพและทดสอบกับอุปกรณ์ของผู้ใช้ปลายทาง TensorFlow มีหลายวิธีในการทำเช่นนี้

  • TensorBoard เป็นเครื่องมือสำหรับการวัดและการแสดงภาพที่จำเป็นในระหว่างขั้นตอนการทำงานของแมชชีนเลิร์นนิง ซึ่งช่วยให้สามารถติดตามเมตริกการทดสอบ เช่น การสูญเสียและความแม่นยำ การแสดงภาพกราฟแบบจำลอง การฉายภาพการฝังไปยังพื้นที่มิติที่ต่ำกว่า และอื่นๆ อีกมากมาย
  • เครื่องมือเปรียบเทียบ มีให้บริการสำหรับแต่ละแพลตฟอร์มที่รองรับ เช่น แอปเกณฑ์มาตรฐาน Android และแอปเกณฑ์มาตรฐาน iOS ใช้เครื่องมือเหล่านี้เพื่อวัดและคำนวณสถิติสำหรับตัวชี้วัดประสิทธิภาพที่สำคัญ

การเพิ่มประสิทธิภาพโมเดล

ด้วย ข้อจำกัด เกี่ยวกับทรัพยากรเฉพาะสำหรับรุ่น TensorFlow Lite การปรับโมเดลให้เหมาะสมสามารถช่วยรับประกันประสิทธิภาพของโมเดลของคุณได้ดีและใช้ทรัพยากรในการประมวลผลน้อยลง ประสิทธิภาพของโมเดลแมชชีนเลิร์นนิงมักจะเป็นความสมดุลระหว่างขนาดและความเร็วของการอนุมานเทียบกับความแม่นยำ ปัจจุบัน TensorFlow Lite รองรับการปรับให้เหมาะสมผ่าน quantization, pruning และ clustering ดูหัวข้อการปรับ โมเดล ให้เหมาะสมสำหรับรายละเอียดเพิ่มเติมเกี่ยวกับเทคนิคเหล่านี้ TensorFlow ยังมี ชุดเครื่องมือการเพิ่มประสิทธิภาพโมเดล ซึ่งมี API ที่ใช้เทคนิคเหล่านี้

ขั้นตอนถัดไป