تم التحديث: يونيو 2021

تم استخدام مجموعة أدوات تحسين نماذج TensorFlow (MOT) على نطاق واسع لتحويل/تحسين نماذج TensorFlow إلى نماذج TensorFlow Lite ذات الحجم الأصغر والأداء الأفضل والدقة المقبولة لتشغيلها على الأجهزة المحمولة وأجهزة إنترنت الأشياء. نحن نعمل الآن على توسيع تقنيات وأدوات MOT إلى ما هو أبعد من TensorFlow Lite لدعم TensorFlow SavedModel أيضًا.

يمثل ما يلي نظرة عامة رفيعة المستوى على خارطة الطريق الخاصة بنا. يجب أن تدرك أن خريطة الطريق هذه قد تتغير في أي وقت وأن الترتيب أدناه لا يعكس أي نوع من الأولوية. نحن نشجعك بشدة على التعليق على خريطة الطريق الخاصة بنا وتقديم تعليقات إلينا في مجموعة المناقشة .

توضيح

TensorFlow لايت

  • التكميم الانتقائي بعد التدريب لاستبعاد طبقات معينة من التكميم.
  • مصحح أخطاء القياس الكمي لفحص خسائر أخطاء القياس الكمي لكل طبقة.
  • تطبيق تدريب مدرك للكمية على المزيد من تغطية النماذج، مثل TensorFlow Model Garden.
  • تحسينات الجودة والأداء للنطاق الديناميكي بعد التدريب. توضيح.

TensorFlow

  • تكميم ما بعد التدريب (bf16 * int8 النطاق الديناميكي).
  • التدريب على الوعي الكمي ((bf16 * int8 الوزن فقط مع الكمية المزيفة).
  • التكميم الانتقائي بعد التدريب لاستبعاد طبقات معينة من التكميم.
  • مصحح أخطاء القياس الكمي لفحص خسائر أخطاء القياس الكمي لكل طبقة.

متناثرة

TensorFlow لايت

  • دعم تنفيذ النماذج المتفرقة لمزيد من النماذج.
  • استهداف التأليف الواعي لـ Sparsity.
  • قم بتوسيع مجموعة العمليات المتفرقة باستخدام حبات x86 عالية الأداء.

TensorFlow

  • دعم Sparity في TensorFlow.

تقنيات الضغط المتتالية

  • التكميم + ضغط الموتر + التفرق: إظهار التقنيات الثلاثة التي تعمل معًا.

ضغط

  • واجهة برمجة تطبيقات ضغط Tensor لمساعدة مطوري خوارزمية الضغط على تنفيذ خوارزمية ضغط النماذج الخاصة بهم (مثل تجميع الوزن) بما في ذلك توفير طريقة قياسية للاختبار/قياس الأداء.