TensorFlow Lite 轉換工具

TensorFlow Lite 轉換工具可使用 TensorFlow 模型產生 TensorFlow Lite 模型 (副檔名為 .tflite 的最佳化 FlatBuffer 格式)。您可以透過下列兩種方式使用轉換工具:

  1. Python API (建議):這個 API 可讓您在模型開發管線中輕鬆轉換模型、套用最佳化方法、新增中繼資料,而且還有許多其他功能。
  2. 指令列:僅支援基本模型轉換。

TFLite 轉換工具的工作流程

Python API

輔助程式碼:如要識別已安裝的 TensorFlow 版本,請執行 print(tf.__version__);如要進一步瞭解 TensorFlow Lite 轉換工具 API,請執行 print(help(tf.lite.TFLiteConverter))

如果已安裝 TensorFlow 2.x,您有以下兩個方式可選擇:(如果已安裝 TensorFlow 1.x,請參閱 GitHub)

以下範例說明如何將 SavedModel 轉換為 TensorFlow Lite 模型。

import tensorflow as tf

# Convert the model
converter = tf.lite.TFLiteConverter.from_saved_model(saved_model_dir) # path to the SavedModel directory
tflite_model = converter.convert()

# Save the model.
with open('model.tflite', 'wb') as f:
  f.write(tflite_model)

轉換 Keras 模型

以下範例說明如何將 Keras 模型轉換為 TensorFlow Lite 模型。

import tensorflow as tf

# Create a model using high-level tf.keras.* APIs
model = tf.keras.models.Sequential([
    tf.keras.layers.Dense(units=1, input_shape=[1]),
    tf.keras.layers.Dense(units=16, activation='relu'),
    tf.keras.layers.Dense(units=1)
])
model.compile(optimizer='sgd', loss='mean_squared_error') # compile the model
model.fit(x=[-1, 0, 1], y=[-3, -1, 1], epochs=5) # train the model
# (to generate a SavedModel) tf.saved_model.save(model, "saved_model_keras_dir")

# Convert the model.
converter = tf.lite.TFLiteConverter.from_keras_model(model)
tflite_model = converter.convert()

# Save the model.
with open('model.tflite', 'wb') as f:
  f.write(tflite_model)

轉換具體函式

以下範例說明如何將具體函式轉換為 TensorFlow Lite 模型。

import tensorflow as tf

# Create a model using low-level tf.* APIs
class Squared(tf.Module):
  @tf.function(input_signature=[tf.TensorSpec(shape=[None], dtype=tf.float32)])
  def __call__(self, x):
    return tf.square(x)
model = Squared()
# (ro run your model) result = Squared(5.0) # This prints "25.0"
# (to generate a SavedModel) tf.saved_model.save(model, "saved_model_tf_dir")
concrete_func = model.__call__.get_concrete_function()

# Convert the model.
# Notes that for the versions earlier than TensorFlow 2.7, the
# from_concrete_functions API is able to work when there is only the first
# argument given:
# > converter = tf.lite.TFLiteConverter.from_concrete_functions([concrete_func])
converter = tf.lite.TFLiteConverter.from_concrete_functions([concrete_func],
                                                            model)
tflite_model = converter.convert()

# Save the model.
with open('model.tflite', 'wb') as f:
  f.write(tflite_model)

其他功能

  • 套用最佳化方法。常用的最佳化方法為訓練後的量化,這個方法可在盡量不犧牲準確率的前提下,進一步減少模型的延遲並縮減大小。

  • 新增中繼資料,以便在裝置上部署模型時,更輕鬆地建立平台專屬的包裝函式程式碼。

轉換錯誤

以下是常見的轉換錯誤及相應的解決方案:

  • 錯誤:Some ops are not supported by the native TFLite runtime, you can enable TF kernels fallback using TF Select. See instructions: <a href="https://www.tensorflow.org/lite/guide/ops_select">https://www.tensorflow.org/lite/guide/ops_select</a> TF Select ops: ..., .., ...

    解決方案:模型的 TF 運算沒有相應的 TFLite 導入程序時,就會發生這個錯誤。如要解決這個問題,您可以在 TFLite 模型中使用 TF 運算 (建議)。 如果只想使用 TFLite 運算來產生模型,您可在 GitHub 問題 21526 下方新增回覆,以索取遺失的 TFLite 運算 (如果還沒有人提到這個問題,請開啟新的會話串),或自行建立 TFLite 運算

  • 錯誤:.. is neither a custom op nor a flex op

    解決方案:如果這個 TF 運算:

指令列工具

強烈建議您盡可能改用上述的 Python API

如果您已從 pip 安裝 TensorFlow 2.x,請按照下列方式使用 tflite_convert 指令 (如果您已從原始碼安裝 TensorFlow 2.x,可在以下小節中以「bazel run //tensorflow/lite/python:tflite_convert --」取代「tflite_convert」;如果您已安裝 TensorFlow 1.x,請參考 GitHub 上的參考資料範例)

tflite_convert:如要查看所有可用旗標,請使用下列指令:

$ tflite_convert --help

`--output_file`. Type: string. Full path of the output file.
`--saved_model_dir`. Type: string. Full path to the SavedModel directory.
`--keras_model_file`. Type: string. Full path to the Keras H5 model file.
`--enable_v1_converter`. Type: bool. (default False) Enables the converter and flags used in TF 1.x instead of TF 2.x.

You are required to provide the `--output_file` flag and either the `--saved_model_dir` or `--keras_model_file` flag.

轉換 SavedModel

tflite_convert \
  --saved_model_dir=/tmp/mobilenet_saved_model \
  --output_file=/tmp/mobilenet.tflite

轉換 Keras H5 模型

tflite_convert \
  --keras_model_file=/tmp/mobilenet_keras_model.h5 \
  --output_file=/tmp/mobilenet.tflite

後續步驟

使用 TensorFlow Lite 解譯器在用戶端裝置 (例如行動裝置、嵌入式裝置) 上執行推論。