Super risoluzione con TensorFlow Lite

Il compito di recuperare un'immagine ad alta risoluzione (HR) dalla sua controparte a bassa risoluzione è comunemente indicato come Single Image Super Resolution (SISR).

Il modello utilizzato è ESRGAN ( ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks ). E useremo TensorFlow Lite per eseguire l'inferenza sul modello preaddestrato.

Il modello TFLite viene convertito da questa implementazione ospitato su TF Hub. Nota che il modello che abbiamo convertito sovracampiona un'immagine a bassa risoluzione 50x50 in un'immagine ad alta risoluzione 200x200 (fattore di scala=4). Se desideri una dimensione di input o un fattore di scala diverso, devi riconvertire o riaddestrare il modello originale.


Installiamo prima le librerie richieste.

pip install matplotlib tensorflow tensorflow-hub

Importa le dipendenze.

import tensorflow as tf
import tensorflow_hub as hub
import matplotlib.pyplot as plt

Scarica e converti il ​​modello ESRGAN

model = hub.load("")
concrete_func = model.signatures[tf.saved_model.DEFAULT_SERVING_SIGNATURE_DEF_KEY]

@tf.function(input_signature=[tf.TensorSpec(shape=[1, 50, 50, 3], dtype=tf.float32)])
def f(input):
  return concrete_func(input);

converter = tf.lite.TFLiteConverter.from_concrete_functions([f.get_concrete_function()], model)
converter.optimizations = [tf.lite.Optimize.DEFAULT]
tflite_model = converter.convert()

# Save the TF Lite model.
with'ESRGAN.tflite', 'wb') as f:

esrgan_model_path = './ESRGAN.tflite'
Scarica un'immagine di prova (testa di insetto).

test_img_path = tf.keras.utils.get_file('lr.jpg', '')
Genera un'immagine ad alta risoluzione utilizzando TensorFlow Lite

lr =
lr = tf.image.decode_jpeg(lr)
lr = tf.expand_dims(lr, axis=0)
lr = tf.cast(lr, tf.float32)

# Load TFLite model and allocate tensors.
interpreter = tf.lite.Interpreter(model_path=esrgan_model_path)

# Get input and output tensors.
input_details = interpreter.get_input_details()
output_details = interpreter.get_output_details()

# Run the model
interpreter.set_tensor(input_details[0]['index'], lr)

# Extract the output and postprocess it
output_data = interpreter.get_tensor(output_details[0]['index'])
sr = tf.squeeze(output_data, axis=0)
sr = tf.clip_by_value(sr, 0, 255)
sr = tf.round(sr)
sr = tf.cast(sr, tf.uint8)

Visualizza il risultato

lr = tf.cast(tf.squeeze(lr, axis=0), tf.uint8)
plt.figure(figsize = (1, 1))

plt.figure(figsize=(10, 4))
plt.subplot(1, 2, 1)        
plt.title(f'ESRGAN (x4)')

bicubic = tf.image.resize(lr, [200, 200], tf.image.ResizeMethod.BICUBIC)
bicubic = tf.cast(bicubic, tf.uint8)
plt.subplot(1, 2, 2)   



Benchmark delle prestazioni

I numeri di riferimento delle prestazioni sono generati con lo strumento qui descritto .

Nome del modello Dimensioni del modello Dispositivo processore GPU
super risoluzione (ESRGAN) 4.8 Mb Pixel 3 586,8 ms* 128,6 ms
Pixel 4 385,1 ms* 130.3ms

* 4 fili utilizzati