تكميم النطاق الديناميكي بعد التدريب

TensorFlow لايت يدعم الآن تحويل الأوزان إلى 8 بت الدقة كجزء من تحويل نموذج من graphdefs tensorflow إلى تنسيق عازلة شقة TensorFlow لايت. يحقق تكميم النطاق الديناميكي تخفيضًا بمقدار 4x في حجم النموذج. بالإضافة إلى ذلك ، يدعم TFLite التكميم والتخلص من التنشيطات أثناء الطيران للسماح بما يلي:

  1. استخدام حبات كمية لتنفيذ أسرع عند توفرها.
  2. خلط حبات النقطة العائمة مع حبات كمية لأجزاء مختلفة من الرسم البياني.

يتم تخزين عمليات التنشيط دائمًا في النقطة العائمة. بالنسبة للعمليات التي تدعم النوى الكمية ، يتم تحديد كمية التنشيطات إلى 8 بتات من الدقة ديناميكيًا قبل المعالجة ويتم فكها لتعويم الدقة بعد المعالجة. اعتمادًا على النموذج الذي يتم تحويله ، يمكن أن يؤدي ذلك إلى تسريع حساب النقطة العائمة الخالصة.

وعلى النقيض من التدريب علم تكميم ، والأوزان بعد التدريب الكم ومكمم التنشيط بشكل حيوي في الاستدلال في هذا الأسلوب. لذلك ، لا يتم إعادة تدريب أوزان النموذج للتعويض عن الأخطاء التي يسببها التكميم. من المهم التحقق من دقة النموذج الكمي للتأكد من أن التدهور مقبول.

يقوم هذا البرنامج التعليمي بتدريب نموذج MNIST من البداية ، والتحقق من دقته في TensorFlow ، ثم يحول النموذج إلى Tensorflow Lite مسطح مع نطاق ديناميكي. أخيرًا ، يتحقق من دقة النموذج المحول ويقارنه بنموذج الطفو الأصلي.

بناء نموذج MNIST


import logging

import tensorflow as tf
from tensorflow import keras
import numpy as np
import pathlib

تدريب نموذج TensorFlow

# Load MNIST dataset
mnist = keras.datasets.mnist
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

# Normalize the input image so that each pixel value is between 0 to 1.
train_images = train_images / 255.0
test_images = test_images / 255.0

# Define the model architecture
model = keras.Sequential([
  keras.layers.InputLayer(input_shape=(28, 28)),
  keras.layers.Reshape(target_shape=(28, 28, 1)),
  keras.layers.Conv2D(filters=12, kernel_size=(3, 3), activation=tf.nn.relu),
  keras.layers.MaxPooling2D(pool_size=(2, 2)),

# Train the digit classification model
  validation_data=(test_images, test_labels)
1875/1875 [==============================] - 6s 2ms/step - loss: 0.3260 - accuracy: 0.9063 - val_loss: 0.1721 - val_accuracy: 0.9499
على سبيل المثال ، نظرًا لأنك قمت بتدريب النموذج لحقبة واحدة فقط ، فإنه يتدرب فقط بدقة تصل إلى ~ 96٪.

قم بالتحويل إلى نموذج TensorFlow Lite

باستخدام بيثون TFLiteConverter ، يمكنك الآن تحويل نموذج تدريب إلى نموذج TensorFlow لايت.

الآن تحميل نموذج باستخدام TFLiteConverter :

converter = tf.lite.TFLiteConverter.from_keras_model(model)
tflite_model = converter.convert()
اكتبه في ملف tflite:

tflite_models_dir = pathlib.Path("/tmp/mnist_tflite_models/")
tflite_models_dir.mkdir(exist_ok=True, parents=True)
tflite_model_file = tflite_models_dir/"mnist_model.tflite"

لتكمم نموذج على التصدير، تعيين optimizations العلم الأمثل لحجم:

converter.optimizations = [tf.lite.Optimize.DEFAULT]
tflite_quant_model = converter.convert()
tflite_model_quant_file = tflite_models_dir/"mnist_model_quant.tflite"
لاحظ كيف الملف الناتج، ما يقرب من 1/4 حجم.

ls -lh {tflite_models_dir}
total 136K
-rw-rw-r-- 1 kbuilder kbuilder 83K Nov  2 11:23 mnist_model.tflite
-rw-rw-r-- 1 kbuilder kbuilder 24K Nov  2 11:23 mnist_model_quant.tflite
-rw-rw-r-- 1 kbuilder kbuilder 25K Nov  2 11:20 mnist_model_quant_16x8.tflite

قم بتشغيل نماذج TFLite

قم بتشغيل نموذج TensorFlow Lite باستخدام مترجم Python TensorFlow Lite.

تحميل النموذج في مترجم

interpreter = tf.lite.Interpreter(model_path=str(tflite_model_file))
interpreter_quant = tf.lite.Interpreter(model_path=str(tflite_model_quant_file))

اختبر النموذج على صورة واحدة

test_image = np.expand_dims(test_images[0], axis=0).astype(np.float32)

input_index = interpreter.get_input_details()[0]["index"]
output_index = interpreter.get_output_details()[0]["index"]

interpreter.set_tensor(input_index, test_image)
predictions = interpreter.get_tensor(output_index)
import matplotlib.pylab as plt

template = "True:{true}, predicted:{predict}"
_ = plt.title(template.format(true= str(test_labels[0]),

بي إن جي

تقييم النماذج

# A helper function to evaluate the TF Lite model using "test" dataset.
def evaluate_model(interpreter):
  input_index = interpreter.get_input_details()[0]["index"]
  output_index = interpreter.get_output_details()[0]["index"]

  # Run predictions on every image in the "test" dataset.
  prediction_digits = []
  for test_image in test_images:
    # Pre-processing: add batch dimension and convert to float32 to match with
    # the model's input data format.
    test_image = np.expand_dims(test_image, axis=0).astype(np.float32)
    interpreter.set_tensor(input_index, test_image)

    # Run inference.

    # Post-processing: remove batch dimension and find the digit with highest
    # probability.
    output = interpreter.tensor(output_index)
    digit = np.argmax(output()[0])

  # Compare prediction results with ground truth labels to calculate accuracy.
  accurate_count = 0
  for index in range(len(prediction_digits)):
    if prediction_digits[index] == test_labels[index]:
      accurate_count += 1
  accuracy = accurate_count * 1.0 / len(prediction_digits)

  return accuracy

كرر التقييم على النموذج الكمي النطاق الديناميكي للحصول على:


في هذا المثال ، لا يوجد اختلاف في الدقة في النموذج المضغوط.

تحسين نموذج موجود

تستخدم شبكات إعادة الشبكات ذات طبقات التنشيط المسبق (Resnet-v2) على نطاق واسع لتطبيقات الرؤية. قبل المدربين الرسم البياني المجمدة لresnet-v2-101 متاح في Tensorflow المحور .

يمكنك تحويل الرسم البياني المجمد إلى TensorFLow Lite Flatbuffer مع التكميم عن طريق:

import tensorflow_hub as hub

resnet_v2_101 = tf.keras.Sequential([
  keras.layers.InputLayer(input_shape=(224, 224, 3)),

converter = tf.lite.TFLiteConverter.from_keras_model(resnet_v2_101)
# Convert to TF Lite without quantization
resnet_tflite_file = tflite_models_dir/"resnet_v2_101.tflite"
# Convert to TF Lite with quantization
converter.optimizations = [tf.lite.Optimize.DEFAULT]
resnet_quantized_tflite_file = tflite_models_dir/"resnet_v2_101_quantized.tflite"
ls -lh {tflite_models_dir}/*.tflite
-rw-rw-r-- 1 kbuilder kbuilder  83K Nov  2 11:23 /tmp/mnist_tflite_models/mnist_model.tflite
-rw-rw-r-- 1 kbuilder kbuilder  24K Nov  2 11:23 /tmp/mnist_tflite_models/mnist_model_quant.tflite
-rw-rw-r-- 1 kbuilder kbuilder  25K Nov  2 11:20 /tmp/mnist_tflite_models/mnist_model_quant_16x8.tflite
-rw-rw-r-- 1 kbuilder kbuilder 171M Nov  2 11:23 /tmp/mnist_tflite_models/resnet_v2_101.tflite
-rw-rw-r-- 1 kbuilder kbuilder  45M Nov  2 11:24 /tmp/mnist_tflite_models/resnet_v2_101_quantized.tflite

يقل حجم النموذج من 171 ميجا بايت إلى 43 ميجا بايت. دقة هذا النموذج على imagenet يمكن تقييمها باستخدام البرامج النصية المقدمة ل قياس دقة TFLite .

دقة النموذج الأمثل أعلى 1 هي 76.8 ، مثل نموذج النقطة العائمة.