Diese Seite wurde von der Cloud Translation API übersetzt.
Switch to English

TensorFlow Lite Konverter

Der TensorFlow Lite-Konverter verwendet ein TensorFlow-Modell und generiert ein TensorFlow Lite-Modell (ein optimiertes FlatBuffer- Format, das durch die .tflite ist). Sie haben die folgenden zwei Möglichkeiten, den Konverter zu verwenden:

  1. Python-API ( empfohlen ): Dies erleichtert das Konvertieren von Modellen als Teil der Modellentwicklungspipeline, das Anwenden von Optimierungen, das Hinzufügen von Metadaten und viele weitere Funktionen.
  2. Befehlszeile : Dies unterstützt nur die grundlegende Modellkonvertierung.

TFLite-Konverter-Workflow

Python-API

Hilfecode: Um die installierte TensorFlow-Version zu identifizieren, führen Sie print(tf.__version__) mehr über die TensorFlow Lite-Konverter-API zu erfahren, führen Sie print(help(tf.lite.TFLiteConverter)) .

Wenn Sie TensorFlow 2.x installiert haben , haben Sie die folgenden zwei Möglichkeiten: ( Wenn Sie TensorFlow 1.x installiert haben, lesen Sie Github. )

Das folgende Beispiel zeigt, wie ein SavedModel in ein TensorFlow Lite-Modell konvertiert wird.

import tensorflow as tf

# Convert the model
converter = tf.lite.TFLiteConverter.from_saved_model(saved_model_dir) # path to the SavedModel directory
tflite_model = converter.convert().

# Save the model.
with open('model.tflite', 'wb') as f:
  f.write(tflite_model)

Konvertieren Sie ein Keras-Modell

Das folgende Beispiel zeigt, wie ein Keras- Modell in ein TensorFlow Lite-Modell konvertiert wird.

import tensorflow as tf

# Create a model using high-level tf.keras.* APIs
model = tf.keras.models.Sequential([
    tf.keras.layers.Dense(units=1, input_shape=[1])
    tf.keras.layers.Dense(units=16, activation='relu'),
    tf.keras.layers.Dense(units=1)
])
model.compile(optimizer='sgd', loss='mean_squared_error') # compile the model
model.fit(x=[-1, 0, 1], y=[-3, -1, 1], epochs=5) # train the model
# (to generate a SavedModel) tf.saved_model.save(model, "saved_model_keras_dir")

# Convert the model.
converter = tf.lite.TFLiteConverter.from_keras_model(model)
tflite_model = converter.convert()

# Save the model.
with open('model.tflite', 'wb') as f:
  f.write(tflite_model)

Konkrete Funktionen konvertieren

Das folgende Beispiel zeigt, wie konkrete Funktionen in ein TensorFlow Lite-Modell konvertiert werden.

import tensorflow as tf

# Create a model using low-level tf.* APIs
class Squared(tf.Module):
  @tf.function
  def __call__(self, x):
    return tf.square(x)
model = Squared()
# (ro run your model) result = Squared(5.0) # This prints "25.0"
# (to generate a SavedModel) tf.saved_model.save(model, "saved_model_tf_dir")
concrete_func = model.__call__.get_concrete_function()

# Convert the model
converter = tf.lite.TFLiteConverter.from_concrete_functions([concrete_func])
tflite_model = converter.convert()

# Save the model.
with open('model.tflite', 'wb') as f:
  f.write(tflite_model)

Andere Eigenschaften

  • Optimierungen anwenden. Eine häufig verwendete Optimierung ist die Quantisierung nach dem Training , mit der Sie die Latenz und Größe Ihres Modells bei minimalem Genauigkeitsverlust weiter reduzieren können.

  • Behandeln Sie nicht unterstützte Vorgänge. Sie haben folgende Möglichkeiten, wenn Ihr Modell Operatoren hat:

    1. Wird in TensorFlow unterstützt, in TensorFlow Lite jedoch nicht unterstützt: Wenn Sie Größenbeschränkungen haben, müssen Sie den TensorFlow Lite-Operator erstellen. Andernfalls verwenden Sie einfach TensorFlow-Operatoren in Ihrem TensorFlow Lite-Modell.

    2. In TensorFlow nicht unterstützt: Sie müssen den TensorFlow-Operator und anschließend den TensorFlow Lite-Operator erstellen . Wenn Sie beim Erstellen des TensorFlow-Operators nicht erfolgreich waren oder keinen erstellen möchten ( nicht empfohlen, fahren Sie mit Vorsicht fort ), können Sie dennoch mit der Methode register_custom_opdefs konvertieren und dann den TensorFlow Lite-Operator direkt erstellen . Die Methode register_custom_opdefs verwendet eine Liste einer Zeichenfolge, die OpDef (s) enthält. Unten finden Sie ein Beispiel für ein TFLiteAwesomeCustomOp mit 1 Eingabe, 1 Ausgabe und 2 Attributen:

  import tensorflow as tf

  custom_opdef = """name: 'TFLiteAwesomeCustomOp' input_arg:
  { name: 'In' type: DT_FLOAT } output_arg: { name: 'Out' type: DT_FLOAT }
  attr : { name: 'a1' type: 'float'} attr : { name: 'a2' type: 'list(float)'}"""

  # Register custom opdefs before the invocation of converter API.
  tf.lite.python.convert.register_custom_opdefs([custom_opdef])

  converter = tf.lite.TFLiteConverter.from_saved_model(...)
  converter.allow_custom_ops = True

Befehlszeilen-Tool

Es wird dringend empfohlen, wenn möglich stattdessen die oben aufgeführte Python-API zu verwenden.

Wenn Sie TensorFlow 2.x von pip installiert haben , verwenden Sie den Befehl tflite_convert wie folgt: ( Wenn Sie TensorFlow 2.x von der Quelle installiert haben , können Sie ' tflite_convert ' durch ' bazel run //tensorflow/lite/python:tflite_convert -- ersetzen bazel run //tensorflow/lite/python:tflite_convert -- 'in den folgenden Abschnitten. Wenn Sie TensorFlow 1.x installiert haben, beziehen Sie sich auf Github ( Referenz , Beispiele ).

tflite_convert : Verwenden Sie den folgenden Befehl, um alle verfügbaren Flags tflite_convert :

$ tflite_convert --help

`--output_file`. Type: string. Full path of the output file.
`--saved_model_dir`. Type: string. Full path to the SavedModel directory.
`--keras_model_file`. Type: string. Full path to the Keras H5 model file.
`--enable_v1_converter`. Type: bool. (default False) Enables the converter and flags used in TF 1.x instead of TF 2.x.

You are required to provide the `--output_file` flag and either the `--saved_model_dir` or `--keras_model_file` flag.

Konvertieren eines gespeicherten Modells

tflite_convert \
  --saved_model_dir=/tmp/mobilenet_saved_model \
  --output_file=/tmp/mobilenet.tflite

Konvertieren eines Keras H5-Modells

tflite_convert \
  --keras_model_file=/tmp/mobilenet_keras_model.h5 \
  --output_file=/tmp/mobilenet.tflite

Nächste Schritte

  • Fügen Sie Metadaten hinzu , um das Erstellen von plattformspezifischem Wrapper-Code beim Bereitstellen von Modellen auf Geräten zu vereinfachen.
  • Verwenden Sie den TensorFlow Lite-Interpreter , um Inferenzen auf einem Clientgerät (z. B. mobil, eingebettet) auszuführen.