TensorFlow Lite-Konverter

Der TensorFlow Lite - Wandler nimmt ein TensorFlow Modell und erzeugt ein TensorFlow Lite - Modell (ein optimiertes FlatBuffer Format , das von der identifizierten .tflite Dateierweiterung). Sie haben die folgenden zwei Möglichkeiten, den Konverter zu verwenden:

  1. Python API (empfohlen): Das macht es einfacher Modelle als Teil der Modellentwicklungspipeline zu konvertieren, wenden Optimierungen, Metadaten hinzufügen und hat viele weitere Features.
  2. Befehlszeile : Dies unterstützt nur Basismodell Konvertierung.

TFLite-Konverter-Workflow

Python-API

Helper - Code: So identifizieren Sie die installierte Version TensorFlow, führen print(tf.__version__) und mehr über die TensorFlow Lite Konverter API, laufen zu lernen print(help(tf.lite.TFLiteConverter)) .

Wenn Sie noch TensorFlow 2.x installiert , haben Sie die folgenden zwei Möglichkeiten: (wenn Sie noch TensorFlow 1.x installiert , beziehen sich auf Github )

Das folgende Beispiel zeigt , wie ein konvertieren SavedModel in ein TensorFlow Lite - Modell.

import tensorflow as tf

# Convert the model
converter = tf.lite.TFLiteConverter.from_saved_model(saved_model_dir) # path to the SavedModel directory
tflite_model = converter.convert()

# Save the model.
with open('model.tflite', 'wb') as f:
  f.write(tflite_model)

Konvertieren eines Keras-Modells

Das folgende Beispiel zeigt , wie ein konvertieren Keras Modell in ein TensorFlow Lite - Modell.

import tensorflow as tf

# Create a model using high-level tf.keras.* APIs
model = tf.keras.models.Sequential([
    tf.keras.layers.Dense(units=1, input_shape=[1]),
    tf.keras.layers.Dense(units=16, activation='relu'),
    tf.keras.layers.Dense(units=1)
])
model.compile(optimizer='sgd', loss='mean_squared_error') # compile the model
model.fit(x=[-1,\xa00, 1], y=[-3, -1, 1], epochs=5) # train the model
# (to generate a SavedModel) tf.saved_model.save(model, "saved_model_keras_dir")

# Convert the model.
converter = tf.lite.TFLiteConverter.from_keras_model(model)
tflite_model = converter.convert()

# Save the model.
with open('model.tflite', 'wb') as f:
  f.write(tflite_model)

Konvertieren Sie konkrete Funktionen

Das folgende Beispiel zeigt , wie man konvertiert konkrete Funktionen in ein TensorFlow Lite - Modell.

import tensorflow as tf

# Create a model using low-level tf.* APIs
class Squared(tf.Module):
  @tf.function
  def __call__(self, x):
    return tf.square(x)
model = Squared()
# (ro run your model) result = Squared(5.0) # This prints "25.0"
# (to generate a SavedModel) tf.saved_model.save(model, "saved_model_tf_dir")
concrete_func = model.__call__.get_concrete_function()

# Convert the model
converter = tf.lite.TFLiteConverter.from_concrete_functions([concrete_func],
                                                            model)
tflite_model = converter.convert()

# Save the model.
with open('model.tflite', 'wb') as f:
  f.write(tflite_model)

Andere Eigenschaften

  • Bewerben Optimierungen . Eine gemeinsame Optimierung verwendet wird , ist nach dem Training Quantisierung , die weiter Modell Latenz und Größe mit minimalem Verlust an Genauigkeit reduzieren.

  • Behandeln Sie nicht unterstützte Vorgänge. Sie haben die folgenden Optionen, wenn Ihr Modell über Operatoren verfügt:

    1. Unterstützt in TensorFlow aber nicht unterstützte in TensorFlow Lite: Wenn Sie Größenbeschränkungen haben, müssen Sie die TensorFlow Lite Betreiber schaffen , sonst nur verwenden TensorFlow Operatoren in Ihrem TensorFlow Lite - Modell.

    2. Nicht unterstützte in TensorFlow: Sie müssen den TensorFlow Operator erstellen und dann die TensorFlow Lite Operator erstellen . Wenn Sie bei der Erstellung des TensorFlow Betreibers nicht erfolgreich waren oder nicht wollen , erstellen (nicht empfohlen, mit Vorsicht vorgehen), können Sie wandeln die Verwendung register_custom_opdefs Methode und dann direkt erstellen den TensorFlow Lite Operator . Die register_custom_opdefs Verfahren nimmt eine Liste einer Zeichenkette enthält einen OpDef (s). Unten ist ein Beispiel eines TFLiteAwesomeCustomOp mit 1 Eingang, Ausgang 1 und 2 Attributen:

        import tensorflow as tf
      
        custom_opdef = """name: 'TFLiteAwesomeCustomOp' input_arg:
        { name: 'In' type: DT_FLOAT } output_arg: { name: 'Out' type: DT_FLOAT }
        attr : { name: 'a1' type: 'float'} attr : { name: 'a2' type: 'list(float)'}"""
      
        # Register custom opdefs before the invocation of converter API.
        tf.lite.python.convert.register_custom_opdefs([custom_opdef])
      
        converter = tf.lite.TFLiteConverter.from_saved_model(...)
        converter.allow_custom_ops = True
      

Befehlszeilentool

Es wird dringend empfohlen, die Verwendung Python API oben statt aufgelistet, falls möglich.

Wenn Sie noch TensorFlow 2.x von pip installiert , verwenden Sie den tflite_convert Befehl wie folgt: (wenn Sie noch TensorFlow 2.x von der tflite_convert bazel run //tensorflow/lite/python:tflite_convert -- Quelle installiert , dann können Sie ersetzen ‚ tflite_convert ‘ mit ' bazel run //tensorflow/lite/python:tflite_convert -- 'in den folgenden Abschnitten, und wenn Sie noch TensorFlow 1.x installiert dann auf Github beziehen ( Referenz , Beispiele ))

tflite_convert : alle verfügbaren Flags anzuzeigen, verwenden Sie den folgenden Befehl ein :

$ tflite_convert --help

`--output_file`. Type: string. Full path of the output file.
`--saved_model_dir`. Type: string. Full path to the SavedModel directory.
`--keras_model_file`. Type: string. Full path to the Keras H5 model file.
`--enable_v1_converter`. Type: bool. (default False) Enables the converter and flags used in TF 1.x instead of TF 2.x.

You are required to provide the `--output_file` flag and either the `--saved_model_dir` or `--keras_model_file` flag.

Konvertieren eines gespeicherten Modells

tflite_convert \
  --saved_model_dir=/tmp/mobilenet_saved_model \
  --output_file=/tmp/mobilenet.tflite

Konvertieren eines Keras H5-Modells

tflite_convert \
  --keras_model_file=/tmp/mobilenet_keras_model.h5 \
  --output_file=/tmp/mobilenet.tflite

Nächste Schritte

  • Hinzufügen von Metadaten , die macht es einfacher , plattformspezifische Wrapper - Code zu erstellen , wenn Modelle auf Geräte bereitstellen.
  • Verwenden Sie das TensorFlow Lite - Interpreter zum Laufe Inferenz auf einem Client - Gerät (zB Mobil, eingebettet).