หน้านี้ได้รับการแปลโดย Cloud Translation API
Switch to English

ตัดน้ำหนักที่ไม่มีนัยสำคัญ

ดูแลโดย TensorFlow Model Optimization

เอกสารนี้ให้ภาพรวมเกี่ยวกับการตัดแต่งโมเดลเพื่อช่วยให้คุณพิจารณาว่าเหมาะสมกับกรณีการใช้งานของคุณอย่างไร

ภาพรวม

การตัดแต่งน้ำหนักตามขนาดจะค่อยๆลดน้ำหนักของโมเดลในระหว่างกระบวนการฝึกอบรมเพื่อให้ได้โมเดลที่เบาบาง แบบจำลองแบบกระจัดกระจายจะบีบอัดได้ง่ายกว่าและเราสามารถข้ามศูนย์ระหว่างการอนุมานเพื่อปรับปรุงเวลาในการตอบสนองได้

เทคนิคนี้นำมาปรับปรุงผ่านการบีบอัดโมเดล ในอนาคตการสนับสนุนเฟรมเวิร์กสำหรับเทคนิคนี้จะช่วยปรับปรุงเวลาในการตอบสนอง เราได้เห็นการปรับปรุงการบีบอัดโมเดลมากขึ้นถึง 6 เท่าโดยสูญเสียความแม่นยำน้อยที่สุด

เทคนิคนี้กำลังได้รับการประเมินในแอปพลิเคชั่นการพูดต่างๆเช่นการรู้จำเสียงและการแปลงข้อความเป็นคำพูดและได้รับการทดลองในรูปแบบการมองเห็นและการแปลต่างๆ

เมทริกซ์ความเข้ากันได้ของ API

ผู้ใช้สามารถใช้การตัดแต่งกิ่งด้วย API ต่อไปนี้:

  • การสร้างโมเดล: tf.keras มีเฉพาะโมเดลตามลำดับและฟังก์ชันเท่านั้น
  • เวอร์ชัน TensorFlow: TF 1.x สำหรับเวอร์ชัน 1.14+ และ 2.x
    • tf.compat.v1 มีแพ็กเกจ TF tf.compat.v2 และ tf.compat.v2 มีแพ็กเกจ TF 1.X ไม่รองรับ
  • โหมดการดำเนินการ TensorFlow: ทั้งกราฟและความกระตือรือร้น
  • การฝึกอบรมแบบกระจาย: tf.distribute ด้วยการใช้กราฟเท่านั้น

อยู่ในแผนงานของเราที่จะเพิ่มการสนับสนุนในด้านต่อไปนี้:

ผล

การจำแนกภาพ

รุ่น ความแม่นยำอันดับ 1 ที่ไม่เบาบาง ความแม่นยำเบาบาง ความเบาบาง
InceptionV3 78.1% 78.0% 50%
76.1% 75%
74.6% 87.5%
MobilenetV1 224 71.04% 70.84% 50%

แบบจำลองได้รับการทดสอบบน Imagenet

การแปล

รุ่น BLEU แบบไม่เบาบาง BLEU เบาบาง ความเบาบาง
GNMT EN-DE 26.77 26.86 80%
26.52 85%
26.19 90%
GNMT DE-EN 29.47 29.50 น 80%
29.24 85%
28.81 90%

แบบจำลองใช้ชุดข้อมูล WMT16 ภาษาเยอรมันและภาษาอังกฤษโดยมี news-test2013 เป็นชุด dev และ news-test2015 เป็นชุดทดสอบ

ตัวอย่าง

นอกเหนือจากบท ช่วย สอน Prune with Keras แล้วโปรดดูตัวอย่างต่อไปนี้:

  • ฝึกโมเดล CNN บนภารกิจการจำแนกเลขหลักที่เขียนด้วยลายมือของ MNIST ด้วยการตัดแต่ง: รหัส
  • ฝึกอบรม LSTM ในภารกิจการจำแนกความรู้สึกของ IMDB ด้วยการตัดแต่ง: code

สำหรับพื้นหลังโปรดดู ในการตัดหรือไม่ตัด: การสำรวจประสิทธิภาพของการตัดแต่งสำหรับการบีบอัดโมเดล [ กระดาษ ]