Questa pagina è stata tradotta dall'API Cloud Translation.

Migrazione da Estimator alle API Keras

Visualizza su TensorFlow.org

Esegui in Google Colab

Visualizza l'origine su GitHub

Scarica quaderno

Questa guida mostra come migrare dalle API tf.keras di TensorFlow 1 alle API tf.estimator.Estimator di TensorFlow 2. Innanzitutto, imposterai ed eseguirai un modello di base per la formazione e la valutazione con tf.estimator.Estimator . Quindi, eseguirai i passaggi equivalenti in TensorFlow 2 con le API tf.keras . Imparerai anche come personalizzare la fase di formazione sottoclasse tf.keras.Model e usando tf.GradientTape .

In TensorFlow 1, le API tf.estimator.Estimator di alto livello consentono di addestrare e valutare un modello, nonché di eseguire l'inferenza e salvare il modello (per la pubblicazione).
In TensorFlow 2, utilizza le API Keras per eseguire le attività di cui sopra, come la creazione di modelli , l'applicazione del gradiente, l' addestramento , la valutazione e la previsione.

(Per la migrazione dei flussi di lavoro di salvataggio del modello/checkpoint a TensorFlow 2, consultare le guide alla migrazione SavedModel e Checkpoint .)

Impostare

Inizia con le importazioni e un semplice set di dati:

import tensorflow as tf
import tensorflow.compat.v1 as tf1

features = [[1., 1.5], [2., 2.5], [3., 3.5]]
labels = [[0.3], [0.5], [0.7]]
eval_features = [[4., 4.5], [5., 5.5], [6., 6.5]]
eval_labels = [[0.8], [0.9], [1.]]

TensorFlow 1: addestra e valuta con tf.estimator.Estimator

Questo esempio mostra come eseguire l'addestramento e la valutazione con tf.estimator.Estimator in TensorFlow 1.

Inizia definendo alcune funzioni: una funzione di input per i dati di addestramento, una funzione di input di valutazione per i dati di valutazione e una funzione modello che indica allo Estimator come viene definita l'operazione di addestramento con le caratteristiche e le etichette:

def _input_fn():
  return tf1.data.Dataset.from_tensor_slices((features, labels)).batch(1)

def _eval_input_fn():
  return tf1.data.Dataset.from_tensor_slices(
      (eval_features, eval_labels)).batch(1)

def _model_fn(features, labels, mode):
  logits = tf1.layers.Dense(1)(features)
  loss = tf1.losses.mean_squared_error(labels=labels, predictions=logits)
  optimizer = tf1.train.AdagradOptimizer(0.05)
  train_op = optimizer.minimize(loss, global_step=tf1.train.get_global_step())
  return tf1.estimator.EstimatorSpec(mode, loss=loss, train_op=train_op)

Istanzia il tuo Estimator e addestra il modello:

estimator = tf1.estimator.Estimator(model_fn=_model_fn)
estimator.train(_input_fn)

INFO:tensorflow:Using default config.
WARNING:tensorflow:Using temporary folder as model directory: /tmp/tmpeovq622_
INFO:tensorflow:Using config: {'_model_dir': '/tmp/tmpeovq622_', '_tf_random_seed': None, '_save_summary_steps': 100, '_save_checkpoints_steps': None, '_save_checkpoints_secs': 600, '_session_config': allow_soft_placement: true
graph_options {
  rewrite_options {
    meta_optimizer_iterations: ONE
  }
}
, '_keep_checkpoint_max': 5, '_keep_checkpoint_every_n_hours': 10000, '_log_step_count_steps': 100, '_train_distribute': None, '_device_fn': None, '_protocol': None, '_eval_distribute': None, '_experimental_distribute': None, '_experimental_max_worker_delay_secs': None, '_session_creation_timeout_secs': 7200, '_checkpoint_save_graph_def': True, '_service': None, '_cluster_spec': ClusterSpec({}), '_task_type': 'worker', '_task_id': 0, '_global_id_in_cluster': 0, '_master': '', '_evaluation_master': '', '_is_chief': True, '_num_ps_replicas': 0, '_num_worker_replicas': 1}
WARNING:tensorflow:From /tmpfs/src/tf_docs_env/lib/python3.7/site-packages/tensorflow/python/training/training_util.py:236: Variable.initialized_value (from tensorflow.python.ops.variables) is deprecated and will be removed in a future version.
Instructions for updating:
Use Variable.read_value. Variables in 2.X are initialized automatically both in eager and graph (inside tf.defun) contexts.
INFO:tensorflow:Calling model_fn.
WARNING:tensorflow:From /tmpfs/src/tf_docs_env/lib/python3.7/site-packages/tensorflow/python/training/adagrad.py:77: calling Constant.__init__ (from tensorflow.python.ops.init_ops) with dtype is deprecated and will be removed in a future version.
Instructions for updating:
Call initializer instance with the dtype argument instead of passing it to the constructor
INFO:tensorflow:Done calling model_fn.
INFO:tensorflow:Create CheckpointSaverHook.
INFO:tensorflow:Graph was finalized.
INFO:tensorflow:Running local_init_op.
INFO:tensorflow:Done running local_init_op.
INFO:tensorflow:Calling checkpoint listeners before saving checkpoint 0...
INFO:tensorflow:Saving checkpoints for 0 into /tmp/tmpeovq622_/model.ckpt.
INFO:tensorflow:Calling checkpoint listeners after saving checkpoint 0...
INFO:tensorflow:loss = 2.0834494, step = 0
INFO:tensorflow:Calling checkpoint listeners before saving checkpoint 3...
INFO:tensorflow:Saving checkpoints for 3 into /tmp/tmpeovq622_/model.ckpt.
INFO:tensorflow:Calling checkpoint listeners after saving checkpoint 3...
INFO:tensorflow:Loss for final step: 9.88002.
<tensorflow_estimator.python.estimator.estimator.Estimator at 0x7fbd06673350>

Valuta il programma con il set di valutazione:

estimator.evaluate(_eval_input_fn)

INFO:tensorflow:Calling model_fn.
INFO:tensorflow:Done calling model_fn.
INFO:tensorflow:Starting evaluation at 2021-10-26T01:32:58
INFO:tensorflow:Graph was finalized.
INFO:tensorflow:Restoring parameters from /tmp/tmpeovq622_/model.ckpt-3
INFO:tensorflow:Running local_init_op.
INFO:tensorflow:Done running local_init_op.
INFO:tensorflow:Inference Time : 0.10194s
INFO:tensorflow:Finished evaluation at 2021-10-26-01:32:58
INFO:tensorflow:Saving dict for global step 3: global_step = 3, loss = 20.543152
INFO:tensorflow:Saving 'checkpoint_path' summary for global step 3: /tmp/tmpeovq622_/model.ckpt-3
{'loss': 20.543152, 'global_step': 3}

TensorFlow 2: addestra e valuta con i metodi Keras integrati

Questo esempio mostra come eseguire l'addestramento e la valutazione con Keras Model.fit e Model.evaluate in TensorFlow 2. (Puoi saperne di più nella Guida all'addestramento e alla valutazione con la guida ai metodi integrati .)

Inizia preparando la pipeline del set di dati con le API tf.data.Dataset .
Definisci un semplice modello Keras Sequential con un livello lineare ( tf.keras.layers.Dense ).
Istanziare un ottimizzatore Adagrad ( tf.keras.optimizers.Adagrad ).
Configurare il modello per l'addestramento passando la variabile optimizer e la perdita dell'errore quadratico medio ( "mse" ) a Model.compile .

dataset = tf.data.Dataset.from_tensor_slices((features, labels)).batch(1)
eval_dataset = tf.data.Dataset.from_tensor_slices(
      (eval_features, eval_labels)).batch(1)

model = tf.keras.models.Sequential([tf.keras.layers.Dense(1)])
optimizer = tf.keras.optimizers.Adagrad(learning_rate=0.05)

model.compile(optimizer=optimizer, loss="mse")

Con ciò, sei pronto per addestrare il modello chiamando Model.fit :

model.fit(dataset)

3/3 [==============================] - 0s 2ms/step - loss: 0.2785
<keras.callbacks.History at 0x7fbc4b320350>

Infine, valuta il modello con Model.evaluate :

model.evaluate(eval_dataset, return_dict=True)

3/3 [==============================] - 0s 1ms/step - loss: 0.0451
{'loss': 0.04510306194424629}

TensorFlow 2: addestra e valuta con una fase di formazione personalizzata e metodi Keras integrati

In TensorFlow 2, puoi anche scrivere la tua funzione di allenamento personalizzata con tf.GradientTape per eseguire passaggi avanti e indietro, sfruttando comunque il supporto di formazione integrato, come tf.keras.callbacks.Callback e tf.distribute.Strategy . (Ulteriori informazioni in Personalizzazione di ciò che accade in Model.fit e Scrittura di cicli di formazione personalizzati da zero .)

In questo esempio, inizia creando un tf.keras.Model personalizzato creando una sottoclasse tf.keras.Sequential che sovrascrive Model.train_step . (Ulteriori informazioni sulla sottoclasse tf.keras.Model ). All'interno di tale classe, definisci una funzione train_step personalizzata che per ogni batch di dati esegua un passaggio in avanti e un passaggio all'indietro durante un passaggio di addestramento.

class CustomModel(tf.keras.Sequential):
  """A custom sequential model that overrides `Model.train_step`."""

  def train_step(self, data):
    batch_data, labels = data

    with tf.GradientTape() as tape:
      predictions = self(batch_data, training=True)
      # Compute the loss value (the loss function is configured
      # in `Model.compile`).
      loss = self.compiled_loss(labels, predictions)

    # Compute the gradients of the parameters with respect to the loss.
    gradients = tape.gradient(loss, self.trainable_variables)
    # Perform gradient descent by updating the weights/parameters.
    self.optimizer.apply_gradients(zip(gradients, self.trainable_variables))
    # Update the metrics (includes the metric that tracks the loss).
    self.compiled_metrics.update_state(labels, predictions)
    # Return a dict mapping metric names to the current values.
    return {m.name: m.result() for m in self.metrics}

Avanti, come prima:

Preparare la pipeline del set di dati con tf.data.Dataset .
Definisci un modello semplice con un livello tf.keras.layers.Dense .
Istanzia Adagrad ( tf.keras.optimizers.Adagrad )
Configurare il modello per l'addestramento con Model.compile , utilizzando l'errore quadratico medio ( "mse" ) come funzione di perdita.

dataset = tf.data.Dataset.from_tensor_slices((features, labels)).batch(1)
eval_dataset = tf.data.Dataset.from_tensor_slices(
      (eval_features, eval_labels)).batch(1)

model = CustomModel([tf.keras.layers.Dense(1)])
optimizer = tf.keras.optimizers.Adagrad(learning_rate=0.05)

model.compile(optimizer=optimizer, loss="mse")

Chiama Model.fit per addestrare il modello:

model.fit(dataset)

3/3 [==============================] - 0s 2ms/step - loss: 0.0587
<keras.callbacks.History at 0x7fbc3873f1d0>

E, infine, valuta il programma con Model.evaluate :

model.evaluate(eval_dataset, return_dict=True)

3/3 [==============================] - 0s 2ms/step - loss: 0.0197
{'loss': 0.019738242030143738}

Prossimi passi

Risorse aggiuntive di Keras che potresti trovare utili:

Le seguenti guide possono aiutare con la migrazione dei flussi di lavoro della strategia di distribuzione dalle API di tf.estimator :