Konwerter TensorFlow Lite przyjmuje model TensorFlow i generuje model TensorFlow Lite (zoptymalizowany format FlatBuffer identyfikowany przez rozszerzenie pliku .tflite
). Masz dwie możliwości korzystania z konwertera:
- Python API ( zalecane ): Ułatwia to konwertowanie modeli w ramach potoku tworzenia modeli, stosowanie optymalizacji, dodawanie metadanych i ma wiele innych funkcji.
- Wiersz poleceń : obsługuje tylko podstawową konwersję modelu.
Python API
Kod pomocniczy: Aby zidentyfikować zainstalowaną wersję TensorFlow, uruchom print(tf.__version__)
a aby dowiedzieć się więcej o API konwertera TensorFlow Lite, uruchom print(help(tf.lite.TFLiteConverter))
.
Jeśli zainstalowałeś TensorFlow 2.x , masz dwie możliwości: ( jeśli zainstalowałeś TensorFlow 1.x , zajrzyj na Github )
Konwertuj model TensorFlow 2.x przy użyciu
tf.lite.TFLiteConverter
. Model TensorFlow 2.x jest przechowywany w formacie SavedModel i jest generowany za pomocątf.keras.*
interfejsów APItf.keras.*
(Model Keras) lub niskopoziomowych interfejsów APItf.*
(Z których generujesz konkretne funkcje). W rezultacie masz następujące trzy opcje (przykłady znajdują się w kilku następnych sekcjach):tf.lite.TFLiteConverter.from_saved_model()
( zalecane ): Konwertuje SavedModel .tf.lite.TFLiteConverter.from_keras_model()
: konwertuje model Keras .tf.lite.TFLiteConverter.from_concrete_functions()
: Konwertuje konkretne funkcje .
Konwertuj model TensorFlow 1.x przy użyciu
tf.compat.v1.lite.TFLiteConverter
(przykłady znajdują się na Github ):-
tf.compat.v1.lite.TFLiteConverter.from_saved_model()
: Konwertuje SavedModel . -
tf.compat.v1.lite.TFLiteConverter.from_keras_model_file()
: konwertuje model Keras . tf.compat.v1.lite.TFLiteConverter.from_session()
: Konwertuje GraphDef z sesji.-
tf.compat.v1.lite.TFLiteConverter.from_frozen_graph()
: Konwertuje Frozen GraphDef z pliku. Jeśli masz punkty kontrolne, najpierw przekonwertuj je na plik Frozen GraphDef, a następnie użyj tego interfejsu API, jak pokazano tutaj .
-
Konwertuj SavedModel (zalecane)
Poniższy przykład pokazuje, jak przekonwertować SavedModel na model TensorFlow Lite.
import tensorflow as tf
# Convert the model
converter = tf.lite.TFLiteConverter.from_saved_model(saved_model_dir) # path to the SavedModel directory
tflite_model = converter.convert()
# Save the model.
with open('model.tflite', 'wb') as f:
f.write(tflite_model)
Konwertuj model Keras
Poniższy przykład pokazuje, jak przekonwertować model Keras na model TensorFlow Lite.
import tensorflow as tf
# Create a model using high-level tf.keras.* APIs
model = tf.keras.models.Sequential([
tf.keras.layers.Dense(units=1, input_shape=[1]),
tf.keras.layers.Dense(units=16, activation='relu'),
tf.keras.layers.Dense(units=1)
])
model.compile(optimizer='sgd', loss='mean_squared_error') # compile the model
model.fit(x=[-1, 0, 1], y=[-3, -1, 1], epochs=5) # train the model
# (to generate a SavedModel) tf.saved_model.save(model, "saved_model_keras_dir")
# Convert the model.
converter = tf.lite.TFLiteConverter.from_keras_model(model)
tflite_model = converter.convert()
# Save the model.
with open('model.tflite', 'wb') as f:
f.write(tflite_model)
Konwertuj konkretne funkcje
Poniższy przykład pokazuje, jak konwertować konkretne funkcje na model TensorFlow Lite.
import tensorflow as tf
# Create a model using low-level tf.* APIs
class Squared(tf.Module):
@tf.function
def __call__(self, x):
return tf.square(x)
model = Squared()
# (ro run your model) result = Squared(5.0) # This prints "25.0"
# (to generate a SavedModel) tf.saved_model.save(model, "saved_model_tf_dir")
concrete_func = model.__call__.get_concrete_function()
# Convert the model
converter = tf.lite.TFLiteConverter.from_concrete_functions([concrete_func])
tflite_model = converter.convert()
# Save the model.
with open('model.tflite', 'wb') as f:
f.write(tflite_model)
Inne funkcje
Zastosuj optymalizacje . Powszechnie stosowaną optymalizacją jest kwantyzacja potreningowa , która może dodatkowo zmniejszyć opóźnienie i rozmiar modelu przy minimalnej utracie dokładności.
Obsługuj nieobsługiwane operacje. Jeśli model ma operatory, masz następujące opcje:
Obsługiwane w TensorFlow, ale nieobsługiwane w TensorFlow Lite: Jeśli masz ograniczenia rozmiaru, musisz utworzyć operator TensorFlow Lite , w przeciwnym razie po prostu użyj operatorów TensorFlow w swoim modelu TensorFlow Lite.
Nieobsługiwany w TensorFlow: musisz utworzyć operator TensorFlow, a następnie utworzyć operator TensorFlow Lite . Jeśli nie udało Ci się utworzyć operatora TensorFlow lub nie chcesz go tworzyć ( niezalecane, postępuj ostrożnie ), nadal możesz dokonać konwersji za pomocą metody
register_custom_opdefs
, a następnie bezpośrednio utworzyć operator TensorFlow Lite . Metodaregister_custom_opdefs
przyjmuje listę ciągów znaków zawierających OpDef (s). Poniżej znajduje się przykładTFLiteAwesomeCustomOp
z 1 wejściem, 1 wyjściem i 2 atrybutami:import tensorflow as tf custom_opdef = """name: 'TFLiteAwesomeCustomOp' input_arg: { name: 'In' type: DT_FLOAT } output_arg: { name: 'Out' type: DT_FLOAT } attr : { name: 'a1' type: 'float'} attr : { name: 'a2' type: 'list(float)'}""" # Register custom opdefs before the invocation of converter API. tf.lite.python.convert.register_custom_opdefs([custom_opdef]) converter = tf.lite.TFLiteConverter.from_saved_model(...) converter.allow_custom_ops = True
Narzędzie wiersza poleceń
Jeśli to możliwe, zdecydowanie zaleca się używanie wymienionego powyżej interfejsu API języka Python .
Jeśli zainstalowałeś TensorFlow 2.x z pip , użyj polecenia tflite_convert
w następujący sposób: ( jeśli zainstalowałeś TensorFlow 2.x ze źródła , możesz zamienić ' tflite_convert
' na ' bazel run //tensorflow/lite/python:tflite_convert --
'w poniższych sekcjach, a jeśli zainstalowałeś TensorFlow 1.x, zapoznaj się z Github ( odniesienia , przykłady ))
tflite_convert
: Aby wyświetlić wszystkie dostępne flagi, użyj następującego polecenia:
$ tflite_convert --help
`--output_file`. Type: string. Full path of the output file.
`--saved_model_dir`. Type: string. Full path to the SavedModel directory.
`--keras_model_file`. Type: string. Full path to the Keras H5 model file.
`--enable_v1_converter`. Type: bool. (default False) Enables the converter and flags used in TF 1.x instead of TF 2.x.
You are required to provide the `--output_file` flag and either the `--saved_model_dir` or `--keras_model_file` flag.
Konwersja SavedModel
tflite_convert \
--saved_model_dir=/tmp/mobilenet_saved_model \
--output_file=/tmp/mobilenet.tflite
Konwersja modelu Keras H5
tflite_convert \
--keras_model_file=/tmp/mobilenet_keras_model.h5 \
--output_file=/tmp/mobilenet.tflite
Następne kroki
- Dodaj metadane , co ułatwia tworzenie kodu opakowania specyficznego dla platformy podczas wdrażania modeli na urządzeniach.
- Użyj interpretera TensorFlow Lite, aby uruchomić wnioskowanie na urządzeniu klienckim (np. Mobilnym , osadzonym).