Crea una pipeline TFX per i tuoi dati con il modello Penguin


Questo documento fornirà le istruzioni per creare una pipeline TensorFlow Extended (TFX) per il tuo set di dati utilizzando il modello pinguino fornito con il pacchetto TFX Python. Inizialmente, la pipeline creata utilizzerà il set di dati Palmer Penguins , ma trasformeremo la pipeline per il tuo set di dati.


  • Linux/MacOS
  • Python 3.6-3.8
  • Quaderno di Giove

Passaggio 1. Copia il modello predefinito nella directory del progetto.

In questo passaggio, creeremo una directory di progetto della pipeline funzionante e file copiando i file dal modello di pinguino in TFX. Puoi pensare a questo come a un'impalcatura per il tuo progetto di pipeline TFX.

Aggiorna Pip

Se stiamo eseguendo in Colab, dovremmo assicurarci di avere l'ultima versione di Pip. I sistemi locali possono ovviamente essere aggiornati separatamente.

import sys
if 'google.colab' in sys.modules:
  !pip install --upgrade pip

Installa il pacchetto richiesto

Innanzitutto, installa TFX e TensorFlow Model Analysis (TFMA).

pip install -U tfx tensorflow-model-analysis

Controlliamo le versioni di TFX.

import tensorflow as tf
import tensorflow_model_analysis as tfma
import tfx

print('TF version: {}'.format(tf.__version__))
print('TFMA version: {}'.format(tfma.__version__))
print('TFX version: {}'.format(tfx.__version__))
TF version: 2.7.1
TFMA version: 0.37.0
TFX version: 1.6.0

Siamo pronti per creare una pipeline.

Imposta PROJECT_DIR sulla destinazione appropriata per il tuo ambiente. Il valore predefinito è ~/imported/${PIPELINE_NAME} , appropriato per l'ambiente Google Cloud AI Platform Notebook .

Puoi assegnare alla pipeline un nome diverso modificando PIPELINE_NAME di seguito. Questo diventerà anche il nome della directory del progetto in cui verranno inseriti i tuoi file.

import os
# Set this project directory to your new tfx pipeline project.
PROJECT_DIR=os.path.join(os.path.expanduser("~"), "imported", PIPELINE_NAME)

Copia i file modello.

TFX include il modello penguin con il pacchetto python TFX. Il modello penguin contiene molte istruzioni per portare il tuo set di dati nella pipeline, che è lo scopo di questo tutorial.

Il tfx template copy CLI copia i file di modello predefiniti nella directory del progetto.

# Set `PATH` to include user python binary directory and a directory containing `skaffold`.
%env PATH={PATH}:/home/jupyter/.local/bin

!tfx template copy \
  --pipeline-name={PIPELINE_NAME} \
  --destination-path={PROJECT_DIR} \
env: PATH=/tmpfs/src/tf_docs_env/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games:/snap/bin:/opt/puppetlabs/bin:/opt/android-studio/current/bin:/usr/local/go/bin:/usr/local/go/packages/bin:/opt/kubernetes/client/bin/:/home/kbuilder/.local/bin:/home/jupyter/.local/bin
Copying penguin pipeline template -> /home/kbuilder/imported/my_pipeline/ -> /home/kbuilder/imported/my_pipeline/pipeline/ -> /home/kbuilder/imported/my_pipeline/pipeline/ -> /home/kbuilder/imported/my_pipeline/pipeline/ -> /home/kbuilder/imported/my_pipeline/models/ -> /home/kbuilder/imported/my_pipeline/models/ -> /home/kbuilder/imported/my_pipeline/models/ -> /home/kbuilder/imported/my_pipeline/models/ -> /home/kbuilder/imported/my_pipeline/models/ -> /home/kbuilder/imported/my_pipeline/models/ -> /home/kbuilder/imported/my_pipeline/models/ -> /home/kbuilder/imported/my_pipeline/models/ -> /home/kbuilder/imported/my_pipeline/ -> /home/kbuilder/imported/my_pipeline/

Modificare il contesto della directory di lavoro in questo notebook nella directory del progetto.


Sfoglia i file di origine copiati

Il modello TFX fornisce file di scaffold di base per creare una pipeline, inclusi codice sorgente Python e dati di esempio. Il modello penguin utilizza lo stesso set di dati e modello ML di Palmer Penguins dell'esempio Penguin .

Ecco una breve introduzione a ciascuno dei file Python.

  • pipeline : questa directory contiene la definizione della pipeline
    • — definisce le costanti comuni per i corridori della pipeline
    • — definisce i componenti TFX e una pipeline
  • models : questa directory contiene le definizioni del modello ML
    • , — definisce le caratteristiche per il modello
    • , — definisce le routine di preelaborazione per i dati
    • — definisce le costanti del modello
    • , — definisce il modello ML utilizzando framework ML come TensorFlow
  • — definisce un corridore per l'ambiente locale che utilizza il motore di orchestrazione locale
  • — definisce un runner per il motore di orchestrazione di Kubeflow Pipelines

Per impostazione predefinita, il modello include solo componenti TFX standard. Se hai bisogno di alcune azioni personalizzate, puoi creare componenti personalizzati per la tua pipeline. Si prega di consultare la guida ai componenti personalizzati TFX per i dettagli.

File di unit test.

Potresti notare che ci sono alcuni file con nel loro nome. Si tratta di unit test della pipeline e si consiglia di aggiungere altri unit test man mano che si implementano le proprie pipeline. È possibile eseguire unit test fornendo il nome del modulo dei file di test con il flag -m . Di solito puoi ottenere un nome di modulo eliminando l'estensione .py e sostituendo / con . . Per esempio:

import sys
!{sys.executable} -m models.features_test
Running tests under Python 3.7.5: /tmpfs/src/tf_docs_env/bin/python
[ RUN      ] FeaturesTest.testLabelKey
INFO:tensorflow:time(__main__.FeaturesTest.testLabelKey): 0.0s
I0203 11:08:46.306882 140258321348416] time(__main__.FeaturesTest.testLabelKey): 0.0s
[       OK ] FeaturesTest.testLabelKey
[ RUN      ] FeaturesTest.test_session
[  SKIPPED ] FeaturesTest.test_session
Ran 2 tests in 0.001s

OK (skipped=1)

Crea una pipeline TFX nell'ambiente locale.

TFX supporta diversi motori di orchestrazione per eseguire pipeline. Useremo il motore di orchestrazione locale. Il motore di orchestrazione locale viene eseguito senza ulteriori dipendenze ed è adatto per lo sviluppo e il debug poiché viene eseguito in ambiente locale anziché dipendere da cluster di elaborazione remoti.

Utilizzeremo per eseguire la pipeline utilizzando l'agente di orchestrazione locale. Devi creare una pipeline prima di eseguirla. È possibile creare una pipeline con il comando pipeline create .

tfx pipeline create --engine=local
Creating pipeline
INFO:absl:Excluding no splits because exclude_splits is not set.
INFO:absl:Excluding no splits because exclude_splits is not set.
Pipeline "my_pipeline" created successfully.

Il comando pipeline create registra la pipeline definita in senza eseguirla effettivamente.

Eseguirai la pipeline creata con il comando run create nei passaggi seguenti.

Passaggio 2. Importa i TUOI dati nella pipeline.

La pipeline iniziale acquisisce il set di dati pinguino incluso nel modello. Devi inserire i tuoi dati nella pipeline e la maggior parte delle pipeline TFX inizia con il componente ExampleGen.

Scegli un esempioGen

I tuoi dati possono essere archiviati ovunque possa accedere la tua pipeline, su un filesystem locale o distribuito o su un sistema interrogabile. TFX fornisce vari componenti ExampleGen per portare i tuoi dati in una pipeline TFX. È possibile sceglierne uno dai seguenti esempi di generazione di componenti.

Puoi anche creare il tuo ExampleGen, ad esempio, tfx include un ExecampleGen personalizzato che utilizza Presto come origine dati. Consulta la guida per ulteriori informazioni su come utilizzare e sviluppare esecutori personalizzati.

Dopo aver deciso quale ExampleGen utilizzare, dovrai modificare la definizione della pipeline per utilizzare i tuoi dati.

  1. Modifica DATA_PATH in e impostalo sulla posizione dei tuoi file.

    • Se hai file nell'ambiente locale, specifica il percorso. Questa è l'opzione migliore per lo sviluppo o il debug di una pipeline.
    • Se i file sono archiviati in GCS, puoi utilizzare un percorso che inizia con gs://{bucket_name}/... . Assicurati di poter accedere a GCS dal tuo terminale, ad esempio usando gsutil . Se necessario, segui la guida all'autorizzazione in Google Cloud .
    • Se desideri utilizzare un ExampleGen basato su query come BigQueryExampleGen, hai bisogno di un'istruzione Query per selezionare i dati dall'origine dati. Ci sono alcune altre cose che devi impostare per utilizzare Google Cloud BigQuery come origine dati.
    • In pipeline/ :
      • Modifica GOOGLE_CLOUD_PROJECT e GCS_BUCKET_NAME nel tuo progetto GCP e nel nome del bucket. Il bucket dovrebbe esistere prima di eseguire la pipeline.
      • Decommenta e imposta la variabile BIG_QUERY_QUERY sulla tua istruzione di query .
    • In :
      • Commenta l'argomento data_path e decommenta l'argomento della query invece in pipeline.create_pipeline() .
    • In pipeline/ :
      • Commenta l'argomento data_path e decommenta l'argomento della query in create_pipeline() .
      • Usa BigQueryExampleGen invece di CsvExampleGen.
  2. Sostituisci CsvExampleGen esistente nella tua classe ExampleGen in pipeline/ . Ogni classe ExampleGen ha una firma diversa. Consulta la guida ai componenti di ExampleGen per maggiori dettagli. Non dimenticare di importare i moduli richiesti con le istruzioni di import in pipeline/ .

La pipeline iniziale è composta da quattro componenti, ExampleGen , StatisticsGen , SchemaGen e ExampleValidator . Non è necessario modificare nulla per StatisticsGen , SchemaGen e ExampleValidator . Eseguiamo la pipeline per la prima volta.

Dovresti vedere "Component ExampleValidator è terminato". se la pipeline è stata eseguita correttamente.

Esaminare l'output della pipeline.

La pipeline TFX produce due tipi di output, artefatti e un DB di metadati (MLMD) che contiene metadati di artefatti ed esecuzioni di pipeline. La posizione dell'output è definita in . Per impostazione predefinita, gli artefatti vengono archiviati nella directory tfx_pipeline_output e i metadati vengono archiviati come database sqlite nella directory tfx_metadata .

È possibile utilizzare le API MLMD per esaminare questi output. In primo luogo, definiremo alcune funzioni di utilità per cercare gli artefatti di output che sono stati appena prodotti.

import tensorflow as tf
import tfx
from ml_metadata import errors
from ml_metadata.proto import metadata_store_pb2
from tfx.types import artifact_utils

# TODO(b/171447278): Move these functions into TFX library.

def get_latest_executions(store, pipeline_name, component_id = None):
  """Fetch all pipeline runs."""
  if component_id is None:  # Find entire pipeline runs.
    run_contexts = [
        c for c in store.get_contexts_by_type('run')
        if['pipeline_name'].string_value == pipeline_name
  else:  # Find specific component runs.
    run_contexts = [
        c for c in store.get_contexts_by_type('component_run')
        if['pipeline_name'].string_value == pipeline_name and
 ['component_id'].string_value == component_id
  if not run_contexts:
    return []
  # Pick the latest run context.
  latest_context = max(run_contexts,
                       key=lambda c: c.last_update_time_since_epoch)
  return store.get_executions_by_context(

def get_latest_artifacts(store, pipeline_name, component_id = None):
  """Fetch all artifacts from latest pipeline execution."""
  executions = get_latest_executions(store, pipeline_name, component_id)

  # Fetch all artifacts produced from the given executions.
  execution_ids = [ for e in executions]
  events = store.get_events_by_execution_ids(execution_ids)
  artifact_ids = [
      event.artifact_id for event in events
      if event.type == metadata_store_pb2.Event.OUTPUT
  return store.get_artifacts_by_id(artifact_ids)

def find_latest_artifacts_by_type(store, artifacts, artifact_type):
  """Get the latest artifacts of a specified type."""
  # Get type information from MLMD
    artifact_type = store.get_artifact_type(artifact_type)
  except errors.NotFoundError:
    return []
  # Filter artifacts with type.
  filtered_artifacts = [aritfact for aritfact in artifacts
                        if aritfact.type_id ==]
  # Convert MLMD artifact data into TFX Artifact instances.
  return [artifact_utils.deserialize_artifact(artifact_type, artifact)
      for artifact in filtered_artifacts]

from tfx.orchestration.experimental.interactive import visualizations

def visualize_artifacts(artifacts):
  """Visualizes artifacts using standard visualization modules."""
  for artifact in artifacts:
    visualization = visualizations.get_registry().get_visualization(
    if visualization:

from tfx.orchestration.experimental.interactive import standard_visualizations

import pprint

from tfx.orchestration import metadata
from tfx.types import artifact_utils
from tfx.types import standard_artifacts

def preview_examples(artifacts):
  """Preview a few records from Examples artifacts."""
  pp = pprint.PrettyPrinter()
  for artifact in artifacts:
    print("==== Examples artifact:{}({})".format(, artifact.uri))
    for split in artifact_utils.decode_split_names(artifact.split_names):
      print("==== Reading from split:{}".format(split))
      split_uri = artifact_utils.get_split_uri([artifact], split)

      # Get the list of files in this directory (all compressed TFRecord files)
      tfrecord_filenames = [os.path.join(split_uri, name)
                            for name in os.listdir(split_uri)]
      # Create a `TFRecordDataset` to read these files
      dataset =,
      # Iterate over the first 2 records and decode them.
      for tfrecord in dataset.take(2):
        serialized_example = tfrecord.numpy()
        example = tf.train.Example()

import local_runner

metadata_connection_config = metadata.sqlite_metadata_connection_config(

Ora possiamo leggere i metadati degli artefatti di output da MLMD.

with metadata.Metadata(metadata_connection_config) as metadata_handler:
    # Search all aritfacts from the previous pipeline run.
    artifacts = get_latest_artifacts(, PIPELINE_NAME)
    # Find artifacts of Examples type.
    examples_artifacts = find_latest_artifacts_by_type(, artifacts,
    # Find artifacts generated from StatisticsGen.
    stats_artifacts = find_latest_artifacts_by_type(, artifacts,
    # Find artifacts generated from SchemaGen.
    schema_artifacts = find_latest_artifacts_by_type(, artifacts,
    # Find artifacts generated from ExampleValidator.
    anomalies_artifacts = find_latest_artifacts_by_type(, artifacts,

Ora possiamo esaminare gli output di ciascun componente. Tensorflow Data Validation (TFDV) viene utilizzato in StatisticsGen , SchemaGen ed ExampleValidator e TFDV può essere utilizzato per visualizzare gli output di questi componenti.

In questo tutorial, utilizzeremo i metodi di supporto della visualizzazione in TFX che utilizzano TFDV internamente per mostrare la visualizzazione. Consulta il tutorial sui componenti TFX per saperne di più su ciascun componente.

Esaminare il modulo di output ExampleGen

Esaminiamo l'output di ExampleGen. Dai un'occhiata ai primi due esempi per ogni divisione:


Per impostazione predefinita, TFX ExampleGen divide gli esempi in due suddivisioni, train ed eval , ma puoi modificare la configurazione della suddivisione .

Esaminare l'output di StatisticsGen


Queste statistiche vengono fornite a SchemaGen per costruire automaticamente uno schema di dati.

Esaminare l'output di SchemaGen


Questo schema viene automaticamente dedotto dall'output di StatisticsGen. Useremo questo schema generato in questo tutorial, ma puoi anche modificare e personalizzare lo schema .

Esaminare l'output da ExampleValidator


Se sono state rilevate anomalie, puoi rivedere i tuoi dati affinché tutti gli esempi seguano le tue ipotesi. Potrebbero essere utili gli output di altri componenti come StatistcsGen. Le anomalie rilevate non bloccano l'esecuzione della pipeline.

Puoi vedere le funzionalità disponibili dagli output di SchemaGen . Se le tue funzionalità possono essere utilizzate per costruire direttamente il modello ML in Trainer , puoi saltare il passaggio successivo e andare al passaggio 4. Altrimenti puoi eseguire un lavoro di ingegneria delle funzionalità nel passaggio successivo. Il componente Transform è necessario quando sono necessarie operazioni a passaggio completo come il calcolo delle medie, soprattutto quando è necessario ridimensionare.

Passaggio 3. (Facoltativo) Progettazione delle funzionalità con il componente Trasforma.

In questo passaggio, definirai vari lavori di progettazione delle funzionalità che verranno utilizzati dal componente Transform nella pipeline. Per ulteriori informazioni, vedere la guida ai componenti Trasforma .

Ciò è necessario solo se il codice di addestramento richiede funzionalità aggiuntive che non sono disponibili nell'output di ExampleGen. In caso contrario, sentiti libero di avanzare rapidamente al passaggio successivo dell'utilizzo di Trainer.

Definire le caratteristiche del modello

models/ contiene costanti per definire le caratteristiche per il modello inclusi i nomi delle funzioni, la dimensione del vocabolario e così via. Per impostazione predefinita, il modello penguin ha due costanti, FEATURE_KEYS e LABEL_KEY , perché il nostro modello penguin risolve un problema di classificazione utilizzando l'apprendimento supervisionato e tutte le funzionalità sono caratteristiche numeriche continue. Vedi le definizioni delle caratteristiche dall'esempio del taxi di Chicago per un altro esempio.

Implementare la preelaborazione per l'addestramento/servizio in preprocessing_fn().

L'effettiva ingegneria delle funzionalità avviene nella funzione preprocessing_fn() in models/ .

In preprocessing_fn puoi definire una serie di funzioni che manipolano il dict di input dei tensori per produrre il dict di tensori di output. Ci sono funzioni di supporto come scale_to_0_1 e compute_and_apply_vocabulary di trasformazione di TensorFlow oppure puoi semplicemente utilizzare le normali funzioni di TensorFlow. Per impostazione predefinita, il modello penguin include esempi di utilizzo della funzione tft.scale_to_z_score per normalizzare i valori delle caratteristiche.

Consulta la guida alla trasformazione di Tensflow per ulteriori informazioni sulla creazione di preprocessing_fn .

Aggiungi il componente Trasforma alla pipeline.

Se il tuo preprocessing_fn è pronto, aggiungi il componente Transform alla pipeline.

  1. Nel file pipeline/ , decommenta # components.append(transform) per aggiungere il componente alla pipeline.

È possibile aggiornare la pipeline ed eseguirla di nuovo.

Se la pipeline è stata eseguita correttamente, dovresti vedere "La trasformazione del componente è terminata". da qualche parte nel registro. Poiché il componente Transform e il componente ExampleValidator non dipendono l'uno dall'altro, l'ordine delle esecuzioni non è fisso. Detto questo, sia Transform che ExampleValidator possono essere l'ultimo componente nell'esecuzione della pipeline.

Esaminare l'output di Trasforma

Il componente Trasforma crea due tipi di output, un grafico Tensorflow ed esempi trasformati. Gli esempi trasformati sono un tipo di artefatto Esempi prodotto anche da ExampleGen, ma questo contiene invece valori di funzionalità trasformati.

Puoi esaminarli come abbiamo fatto nel passaggio precedente.

with metadata.Metadata(metadata_connection_config) as metadata_handler:
    # Search all aritfacts from the previous run of Transform component.
    artifacts = get_latest_artifacts(,
                                     PIPELINE_NAME, "Transform")
    # Find artifacts of Examples type.
    transformed_examples_artifacts = find_latest_artifacts_by_type(, artifacts,

Passaggio 4. Allena il tuo modello con il componente Trainer.

Costruiremo un modello ML utilizzando il componente Trainer . Per ulteriori informazioni, vedere la guida ai componenti Trainer . È necessario fornire il codice del modello al componente Trainer.

Definisci il tuo modello.

Nel modello pinguino, models.model.run_fn viene utilizzato come argomento run_fn per il componente Trainer . Significa che la funzione run_fn() in models/ verrà chiamata quando il componente Trainer viene eseguito. Puoi vedere il codice per costruire un semplice modello DNN usando l'API keras nel codice specificato. Consulta TensorFlow 2.x nella guida TFX per ulteriori informazioni sull'utilizzo dell'API keras in TFX.

In questo run_fn , dovresti creare un modello e salvarlo in una directory indicata da fn_args.serving_model_dir specificata dal componente. Puoi usare altri argomenti in fn_args che viene passato a run_fn . Vedere i codici correlati per l'elenco completo degli argomenti in fn_args .

Definisci le tue funzionalità in models/ e usale secondo necessità. Se hai trasformato le tue feature nel passaggio 3, dovresti usare le feature trasformate come input per il tuo modello.

Aggiungi il componente Trainer alla pipeline.

Se il tuo run_fn è pronto, aggiungi il componente Trainer alla pipeline.

  1. Nel file pipeline/ , decommentare # components.append(trainer) per aggiungere il componente alla pipeline.

Gli argomenti per il componente trainer potrebbero dipendere dall'utilizzo o meno del componente Transform.

  • Se NON si utilizza il componente Transform , non è necessario modificare gli argomenti.
  • Se utilizzi il componente Transform , devi modificare gli argomenti durante la creazione di un'istanza del componente Trainer .

    • Modifica l'argomento degli examples in examples=transform.outputs['transformed_examples'], . Abbiamo bisogno di usare esempi trasformati per la formazione.
    • Aggiungi un argomento transform_graph come transform_graph=transform.outputs['transform_graph'], . Questo grafico contiene il grafico TensorFlow per le operazioni di trasformazione.
    • Dopo le modifiche precedenti, il codice per la creazione del componente Trainer apparirà come segue.
    # If you use a Transform component.
    trainer = Trainer(

È possibile aggiornare la pipeline ed eseguirla di nuovo.

Quando questa esecuzione viene eseguita correttamente, ora hai creato ed eseguito la tua prima pipeline TFX per il tuo modello. Congratulazioni!

Il tuo nuovo modello si troverà in un punto nella directory di output, ma sarebbe meglio avere un modello in posizione fissa o un servizio al di fuori della pipeline TFX che contiene molti risultati temporanei. Ancora meglio con la valutazione continua del modello costruito, che è fondamentale nei sistemi di produzione ML. Vedremo come funzionano la valutazione continua e le implementazioni in TFX nel passaggio successivo.

Passaggio 5. (Facoltativo) Valuta il modello con Evaluator e pubblicalo con pusher.

Il componente Evaluator valuta continuamente ogni modello creato da Trainer e Pusher copia il modello in una posizione predefinita nel file system o persino nei modelli di piattaforma AI di Google Cloud .

Aggiunge il componente Valutatore alla pipeline.

Nel file pipeline/ :

  1. Decommenta # components.append(model_resolver) per aggiungere l'ultimo risolutore del modello alla pipeline. Valutatore può essere utilizzato per confrontare un modello con il vecchio modello di base che ha superato Valutatore nell'ultima esecuzione della pipeline. LatestBlessedModelResolver trova l'ultimo modello che ha superato Valutatore.
  2. Imposta tfma.MetricsSpec corretto per il tuo modello. La valutazione potrebbe essere diversa per ogni modello ML. Nel modello pinguino è stato utilizzato SparseCategoricalAccuracy perché stiamo risolvendo un problema di classificazione a più categorie. È inoltre necessario specificare tfma.SliceSpec per analizzare il modello per sezioni specifiche. Per maggiori dettagli, vedere la guida ai componenti del valutatore .
  3. Decommentare # components.append(evaluator) per aggiungere il componente alla pipeline.

È possibile aggiornare la pipeline ed eseguirla di nuovo.

Esaminare l'output di Evaluator

Questo passaggio richiede l'estensione del notebook Jupyter TensorFlow Model Analysis (TFMA). Nota che la versione dell'estensione per notebook TFMA dovrebbe essere identica alla versione del pacchetto Python TFMA.

Il comando seguente installerà l'estensione del notebook TFMA dal registro NPM. Potrebbero essere necessari diversi minuti per il completamento.

Se l'installazione è completata, ricaricare il browser per rendere effettiva l'estensione.

with metadata.Metadata(metadata_connection_config) as metadata_handler:
  # Search all aritfacts from the previous pipeline run.
  artifacts = get_latest_artifacts(, PIPELINE_NAME)
  model_evaluation_artifacts = find_latest_artifacts_by_type(, artifacts,
if model_evaluation_artifacts:
  tfma_result = tfma.load_eval_result(model_evaluation_artifacts[0].uri)

Aggiunge il componente Pusher alla pipeline.

Se il modello sembra promettente, dobbiamo pubblicarlo. Il componente Pusher può pubblicare il modello in una posizione nel filesystem o nei modelli GCP AI Platform utilizzando un executor personalizzato .

Il componente Evaluator valuta continuamente ogni modello creato da Trainer e Pusher copia il modello in una posizione predefinita nel file system o persino nei modelli di piattaforma AI di Google Cloud .

  1. In , imposta SERVING_MODEL_DIR su una directory da pubblicare.
  2. Nel file pipeline/ , decommentare # components.append(pusher) per aggiungere Pusher alla pipeline.

È possibile aggiornare la pipeline ed eseguirla di nuovo.

Dovresti riuscire a trovare il tuo nuovo modello su SERVING_MODEL_DIR .

Passaggio 6. (Facoltativo) Distribuisci la pipeline a Kubeflow Pipelines su GCP.

Come accennato in precedenza, è utile per scopi di debug o sviluppo, ma non è la soluzione migliore per i carichi di lavoro di produzione. In questo passaggio, implementeremo la pipeline in Kubeflow Pipelines su Google Cloud.


Abbiamo bisogno del pacchetto python kfp e del programma skaffold per distribuire una pipeline in un cluster Kubeflow Pipelines.

È inoltre necessario un cluster Kubeflow Pipelines per eseguire la pipeline. Segui i passaggi 1 e 2 in TFX on Cloud AI Platform Pipelines tutorial .

Quando il tuo cluster è pronto, apri il dashboard della pipeline facendo clic su Apri dashboard Pipelines nella pagina Pipelines della console cloud di Google . L'URL di questa pagina è ENDPOINT per richiedere un'esecuzione della pipeline. Il valore dell'endpoint è tutto nell'URL dopo https://, fino a incluso. Metti il ​​tuo endpoint nel seguente blocco di codice.

ENDPOINT='' # Enter your ENDPOINT here.

Per eseguire il nostro codice in un cluster Kubeflow Pipelines, dobbiamo comprimere il nostro codice in un'immagine del contenitore. L'immagine verrà creata automaticamente durante la distribuzione della nostra pipeline e devi solo impostare un nome e un registro contenitori per la tua immagine. Nel nostro esempio, utilizzeremo Google Container Registry e lo tfx-pipeline .

# Read GCP project id from env.
Aggiorna la posizione dei dati archiviata in DATA_PATH in .

Se utilizzi BigQueryExampleGen, non è necessario caricare il file di dati, ma assicurati che utilizzi la stessa query e l'argomento beam_pipeline_args per la funzione pipeline.create_pipeline() .

Distribuire la pipeline.

Se tutto è pronto, puoi creare una pipeline usando il comando tfx pipeline create .

Oppure puoi anche eseguire la pipeline nel dashboard di Kubeflow Pipelines. La nuova corsa sarà elencata in Experiments nel dashboard di Kubeflow Pipelines. Facendo clic sull'esperimento sarà possibile monitorare l'avanzamento e visualizzare gli artefatti creati durante l'esecuzione.

Se sei interessato a eseguire la tua pipeline su Kubeflow Pipelines, trova ulteriori istruzioni nel tutorial TFX on Cloud AI Platform Pipelines .


Per ripulire tutte le risorse Google Cloud utilizzate in questo passaggio, puoi eliminare il progetto Google Cloud che hai utilizzato per il tutorial.

In alternativa, puoi ripulire le singole risorse visitando ciascuna console: