Эта страница переведена с помощью Cloud Translation API.

TFX на конвейерах платформы облачного ИИ

Введение

Это руководство предназначено для ознакомления с конвейерами TensorFlow Extended (TFX) и AIPlatform, а также поможет вам научиться создавать собственные конвейеры машинного обучения в Google Cloud. Здесь показана интеграция с TFX, AI Platform Pipelines и Kubeflow, а также взаимодействие с TFX в ноутбуках Jupyter.

В конце этого руководства вы создадите и запустите конвейер машинного обучения, размещенный в Google Cloud. Вы сможете визуализировать результаты каждого запуска и просмотреть происхождение созданных артефактов.

Вы будете следовать типичному процессу разработки машинного обучения, начиная с изучения набора данных и заканчивая полным рабочим конвейером. Попутно вы изучите способы отладки и обновления вашего конвейера, а также измерения производительности.

Набор данных такси Чикаго

Такси Чикаго такси

Вы используете набор данных Taxi Trips, опубликованный властями города Чикаго.

Примечание. На этом сайте представлены приложения, использующие данные, которые были изменены для использования из исходного источника — www.cityofchicago.org, официального сайта города Чикаго. Город Чикаго не предъявляет претензий относительно содержания, точности, актуальности или полноты каких-либо данных, представленных на этом сайте. Данные, представленные на этом сайте, могут быть изменены в любое время. Понятно, что данные, представленные на этом сайте, используются на свой страх и риск.

Подробнее о наборе данных можно прочитать в Google BigQuery . Изучите полный набор данных в пользовательском интерфейсе BigQuery .

Цель модели — двоичная классификация

Будет ли клиент давать чаевые больше или меньше 20%?

1. Настройте проект Google Cloud.

1.a Настройте свою среду в Google Cloud

Для начала вам понадобится учетная запись Google Cloud. Если он у вас уже есть, перейдите к «Создать новый проект» .

Перейдите в облачную консоль Google .
Согласитесь с условиями использования Google Cloud
Если вы хотите начать с бесплатной пробной учетной записи, нажмите «Попробовать бесплатно » (или «Начать бесплатно » ).
1. Выберите вашу страну.
2. Согласитесь с условиями обслуживания.
3. Введите платежные данные.
  На этом этапе с вас не будет взиматься плата. Если у вас нет других проектов Google Cloud, вы можете пройти это руководство, не превышая ограничений уровня бесплатного пользования Google Cloud , который включает максимум 8 ядер, работающих одновременно.

Примечание. На этом этапе вы можете стать платным пользователем вместо того, чтобы полагаться на бесплатную пробную версию. Поскольку это руководство не выходит за рамки ограничений уровня бесплатного пользования, с вас все равно не будет взиматься плата, если это ваш единственный проект и вы остаетесь в этих пределах. Дополнительную информацию см. в разделе «Калькулятор затрат Google Cloud» и «Уровень бесплатного пользования Google Cloud Platform» .

1.б Создайте новый проект.

На главной панели управления Google Cloud щелкните раскрывающийся список проекта рядом с заголовком Google Cloud Platform и выберите «Новый проект» .
Дайте своему проекту имя и введите другие сведения о проекте.
После создания проекта обязательно выберите его из раскрывающегося списка проектов.

2. Настройка и развертывание конвейера платформы AI в новом кластере Kubernetes.

Перейдите на страницу «Кластеры конвейеров платформы AI» .
В главном меню навигации: ≡ > Платформа AI > Конвейеры.
Нажмите + Новый экземпляр , чтобы создать новый кластер.
На странице обзора Kubeflow Pipelines нажмите «Настроить» .
Нажмите «Включить», чтобы включить API Kubernetes Engine.
Примечание. Возможно, вам придется подождать несколько минут, прежде чем двигаться дальше, пока для вас будут включены API-интерфейсы Kubernetes Engine.
На странице «Развертывание конвейеров Kubeflow »:
1. Выберите зону (или «регион») для вашего кластера. Сеть и подсеть можно настроить, но для целей данного руководства мы оставим их по умолчанию.
2. ВАЖНО Установите флажок Разрешить доступ к следующим облачным API . (Это необходимо для того, чтобы этот кластер мог получить доступ к другим частям вашего проекта. Если вы пропустите этот шаг, исправить его позже будет немного сложнее.)
3. Нажмите «Создать новый кластер» и подождите несколько минут, пока кластер не будет создан. Это займет несколько минут. Когда он завершится, вы увидите сообщение типа:
  Кластер «cluster-1» успешно создан в зоне «us-central1-a».
4. Выберите пространство имен и имя экземпляра (можно использовать значения по умолчанию). Для целей данного руководства не проверяйте executor.emissary или Managedstorage.enabled .
5. Нажмите «Развернуть» и подождите несколько секунд, пока конвейер не будет развернут. Развертывая Kubeflow Pipelines, вы принимаете Условия обслуживания.

3. Настройте экземпляр Cloud AI Platform Notebook.

Перейдите на страницу Vertex AI Workbench . При первом запуске Workbench вам необходимо включить API ноутбуков.
В главном меню навигации: ≡ -> Vertex AI -> Workbench.
Если будет предложено, включите Compute Engine API.
Создайте новый блокнот с установленным TensorFlow Enterprise 2.7 (или более поздней версии).
Новый ноутбук -> TensorFlow Enterprise 2.7 -> Без графического процессора
Выберите регион и зону и дайте экземпляру записной книжки имя.
Чтобы оставаться в пределах уровня бесплатного пользования, вам может потребоваться изменить настройки по умолчанию здесь, чтобы уменьшить количество виртуальных ЦП, доступных для этого экземпляра, с 4 до 2:
1. Выберите «Дополнительные параметры» в нижней части формы «Новый блокнот» .
2. В разделе «Конфигурация компьютера» вы можете выбрать конфигурацию с 1 или 2 виртуальными ЦП, если вам нужно оставаться на бесплатном уровне.
3. Подождите, пока будет создана новая записная книжка, а затем нажмите «Включить API записных книжек».

Примечание. Производительность вашего ноутбука может снизиться, если вы используете 1 или 2 виртуальных ЦП вместо значения по умолчанию или выше. Это не должно серьезно помешать вам завершить этот урок. Если вы хотите использовать настройки по умолчанию, обновите свою учетную запись как минимум до 12 виртуальных ЦП. Это приведет к начислению сборов. Дополнительные сведения о ценах, включая калькулятор цен и информацию об уровне бесплатного пользования Google Cloud, см. в разделе «Цены на Google Kubernetes Engine» .

4. Запустите блокнот «Начало работы».

Перейдите на страницу «Кластеры конвейеров платформы AI» .
В главном меню навигации: ≡ -> Платформа AI -> Конвейеры.
В строке кластера, который вы используете в этом руководстве, нажмите «Открыть панель мониторинга конвейеров ».
На странице «Начало работы» нажмите «Открыть блокнот Cloud AI Platform в Google Cloud ».
Выберите экземпляр Notebook, который вы используете для этого руководства, нажмите «Продолжить» , а затем «Подтвердить» .

5. Продолжаем работать в Блокноте.

Установить

Записная книжка по началу работы начинается с установки TFX и Kubeflow Pipelines (KFP) на виртуальную машину, на которой работает Jupyter Lab.

Затем он проверяет, какая версия TFX установлена, выполняет импорт, а также устанавливает и печатает идентификатор проекта:

проверить версию Python и импортировать

Подключитесь к своим облачным сервисам Google

Для конфигурации конвейера требуется идентификатор вашего проекта, который вы можете получить через блокнот и установить в качестве переменной среды.

# Read GCP project id from env.
shell_output=!gcloud config list --format 'value(core.project)' 2>/dev/null
GCP_PROJECT_ID=shell_output[0]
print("GCP project ID:" + GCP_PROJECT_ID)

Теперь установите конечную точку кластера KFP.

Его можно найти по URL-адресу информационной панели Pipelines. Перейдите на панель управления Kubeflow Pipeline и посмотрите URL-адрес. Конечная точка — это все в URL-адресе , начиная с https:// и заканчивая googleusercontent.com включительно.

ENDPOINT='' # Enter YOUR ENDPOINT here.

Затем блокнот задает уникальное имя для пользовательского образа Docker:

# Docker image name for the pipeline image
CUSTOM_TFX_IMAGE='gcr.io/' + GCP_PROJECT_ID + '/tfx-pipeline'

6. Скопируйте шаблон в каталог вашего проекта.

Отредактируйте следующую ячейку блокнота, чтобы задать имя для вашего конвейера. В этом уроке мы будем использовать my_pipeline .

PIPELINE_NAME="my_pipeline"
PROJECT_DIR=os.path.join(os.path.expanduser("~"),"imported",PIPELINE_NAME)

Затем ноутбук использует интерфейс командной строки tfx для копирования шаблона конвейера. В этом руководстве используется набор данных «Такси Чикаго» для выполнения двоичной классификации, поэтому в шаблоне задается модель taxi :

!tfx template copy \
  --pipeline-name={PIPELINE_NAME} \
  --destination-path={PROJECT_DIR} \
  --model=taxi

Затем записная книжка меняет свой контекст CWD на каталог проекта:

%cd {PROJECT_DIR}

Просмотрите файлы конвейера

В левой части записной книжки Cloud AI Platform вы должны увидеть файловый браузер. Должен быть каталог с именем вашего конвейера ( my_pipeline ). Откройте его и просмотрите файлы. (Вы также сможете открывать их и редактировать из среды записной книжки.)

# You can also list the files from the shell
 ls

Команда tfx template copy приведенная выше, создала базовый каркас файлов, которые создают конвейер. К ним относятся исходные коды Python, примеры данных и блокноты Jupyter. Они предназначены для этого конкретного примера. Для ваших собственных конвейеров это будут вспомогательные файлы, необходимые вашему конвейеру.

Вот краткое описание файлов Python.

pipeline — этот каталог содержит определение конвейера.
- configs.py — определяет общие константы для участников конвейера.
- pipeline.py — определяет компоненты TFX и конвейер.
models — этот каталог содержит определения моделей машинного обучения.
- features.py features_test.py — определяет функции модели.
- preprocessing.py / preprocessing_test.py — определяет задания предварительной обработки с использованием tf::Transform
- estimator — этот каталог содержит модель на основе оценщика.
  - constants.py — определяет константы модели.
  - model.py / model_test.py — определяет модель DNN с использованием средства оценки TF.
- keras — этот каталог содержит модель на основе Keras.
  - constants.py — определяет константы модели.
  - model.py / model_test.py — определяет модель DNN с использованием Keras.
beam_runner.py / kubeflow_runner.py — определите бегунов для каждого механизма оркестрации.

7. Запустите свой первый конвейер TFX на Kubeflow.

Ноутбук запустит конвейер с помощью команды CLI tfx run .

Подключиться к хранилищу

Запуск конвейеров создает артефакты, которые необходимо хранить в ML-Metadata . Артефакты относятся к полезным нагрузкам, которые представляют собой файлы, которые должны храниться в файловой системе или блочном хранилище. В этом руководстве мы будем использовать GCS для хранения полезных данных метаданных, используя корзину, созданную автоматически во время установки. Его имя будет <your-project-id>-kubeflowpipelines-default .

Создайте конвейер

Блокнот загрузит наши образцы данных в корзину GCS, чтобы мы могли использовать их в нашем конвейере позже.

gsutil cp data/data.csv gs://{GOOGLE_CLOUD_PROJECT}-kubeflowpipelines-default/tfx-template/data/taxi/data.csv

Затем ноутбук использует команду tfx pipeline create для создания конвейера.

!tfx pipeline create  \
--pipeline-path=kubeflow_runner.py \
--endpoint={ENDPOINT} \
--build-image

При создании конвейера будет создан Dockerfile для создания образа Docker. Не забудьте добавить эти файлы в свою систему контроля версий (например, git) вместе с другими исходными файлами.

Запустите конвейер

Затем блокнот использует команду tfx run create , чтобы начать выполнение вашего конвейера. Вы также увидите этот запуск в списке «Эксперименты» на панели инструментов Kubeflow Pipelines.

tfx run create --pipeline-name={PIPELINE_NAME} --endpoint={ENDPOINT}

Вы можете просмотреть свой конвейер на панели инструментов Kubeflow Pipelines.

8. Проверьте свои данные

Первая задача в любом проекте по науке о данных или ML-проекте — понять и очистить данные.

Понимание типов данных для каждого объекта
Ищите аномалии и пропущенные значения
Понимание распределения каждой функции

Компоненты

Компоненты данных

SampleGen принимает и разделяет входной набор данных.
СтатистикаГен вычисляет статистику для набора данных.
SchemaGen SchemaGen анализирует статистику и создает схему данных.
ПримерВалидатор ищет аномалии и пропущенные значения в наборе данных.

В редакторе файлов Jupyter Lab:

В pipeline / pipeline.py раскомментируйте строки, которые добавляют эти компоненты в ваш конвейер:

# components.append(statistics_gen)
# components.append(schema_gen)
# components.append(example_validator)

( ExampleGen уже был включен при копировании файлов шаблонов.)

Обновите конвейер и перезапустите его.

# Update the pipeline
! tfx pipeline update \
  --pipeline-path=kubeflow_runner.py \
  --endpoint={ENDPOINT}

! tfx run create --pipeline-name "{PIPELINE_NAME}"

Проверьте трубопровод

Для Kubeflow Orchestrator посетите панель управления KFP и найдите выходные данные конвейера на странице запуска вашего конвейера. Нажмите вкладку «Эксперименты» слева и «Все прогоны» на странице «Эксперименты». Вы сможете найти запуск по названию вашего конвейера.

Более продвинутый пример

Представленный здесь пример на самом деле предназначен только для начала. Более продвинутый пример см. в TensorFlow Data Validation Colab .

Дополнительную информацию об использовании TFDV для исследования и проверки набора данных см. в примерах на tensorflow.org .

9. Разработка функций

Вы можете повысить качество прогнозирования ваших данных и/или уменьшить размерность с помощью разработки функций.

Кресты функций
Словари
Вложения
СПС
Категориальное кодирование

Одним из преимуществ использования TFX является то, что вы напишете код преобразования один раз, и полученные преобразования будут согласованы между обучением и обслуживанием.

Компоненты

Трансформировать

Transform выполняет разработку функций набора данных.

В редакторе файлов Jupyter Lab:

В pipeline / pipeline.py найдите и раскомментируйте строку, которая добавляет Transform к конвейеру.

# components.append(transform)

Обновите конвейер и перезапустите его.

# Update the pipeline
! tfx pipeline update \
  --pipeline-path=kubeflow_runner.py \
  --endpoint={ENDPOINT}

! tfx run create --pipeline-name "{PIPELINE_NAME}"

Проверьте выходы конвейера

Более продвинутый пример

Представленный здесь пример на самом деле предназначен только для начала. Более продвинутый пример см. в TensorFlow Transform Colab .

10. Обучение

Обучите модель TensorFlow с помощью красивых, чистых и преобразованных данных.

Включите преобразования из предыдущего шага, чтобы они применялись последовательно.
Сохраните результаты как SavedModel для производства.
Визуализируйте и исследуйте процесс обучения с помощью TensorBoard.
Также сохраните EvalSavedModel для анализа производительности модели.

Компоненты

Тренер обучает модель TensorFlow.

В редакторе файлов Jupyter Lab:

В pipeline / pipeline.py найдите и раскомментируйте файл, который добавляет Trainer к конвейеру:

# components.append(trainer)

Обновите конвейер и перезапустите его.

# Update the pipeline
! tfx pipeline update \
  --pipeline-path=kubeflow_runner.py \
  --endpoint={ENDPOINT}

! tfx run create --pipeline-name "{PIPELINE_NAME}"

Проверьте выходы конвейера

Более продвинутый пример

Представленный здесь пример на самом деле предназначен только для начала. Более продвинутый пример смотрите в TensorBoard Tutorial .

11. Анализ производительности модели

Понимание большего, чем просто показатели верхнего уровня.

Пользователи оценивают производительность модели только для своих запросов.
Низкая производительность на фрагментах данных может быть скрыта метриками верхнего уровня.
Справедливость модели важна
Часто ключевые группы пользователей или данных очень важны и могут быть небольшими.
- Работа в критических, но необычных условиях
- Производительность для ключевых аудиторий, таких как влиятельные лица
Если вы заменяете модель, которая сейчас находится в производстве, сначала убедитесь, что новая лучше.

Компоненты

Оценщик проводит глубокий анализ результатов обучения.

В редакторе файлов Jupyter Lab:

В pipeline / pipeline.py найдите и раскомментируйте строку, которая добавляет Evaluator к конвейеру:

components.append(evaluator)

Обновите конвейер и перезапустите его.

# Update the pipeline
! tfx pipeline update \
  --pipeline-path=kubeflow_runner.py \
  --endpoint={ENDPOINT}

! tfx run create --pipeline-name "{PIPELINE_NAME}"

Проверьте выходы конвейера

12. Обслуживание модели

Если новая модель готова, сделайте это.

Pusher развертывает SavedModels в известных местах

Цели развертывания получают новые модели из известных мест.

Обслуживание TensorFlow
ТензорФлоу Лайт
ТензорФлоу JS
TensorFlow Hub

Компоненты

Pusher развертывает модель в обслуживающей инфраструктуре.

В редакторе файлов Jupyter Lab:

В pipeline / pipeline.py найдите и раскомментируйте строку, которая добавляет Pusher к конвейеру:

# components.append(pusher)

Проверьте выходы конвейера

Доступные цели развертывания

Теперь вы обучили и проверили свою модель, и теперь она готова к производству. Теперь вы можете развернуть свою модель на любой из целей развертывания TensorFlow, включая:

TensorFlow Serving — для обслуживания вашей модели на сервере или ферме серверов и обработки запросов вывода REST и/или gRPC.
TensorFlow Lite для включения вашей модели в собственное мобильное приложение Android или iOS, а также в приложение Raspberry Pi, IoT или микроконтроллера.
TensorFlow.js для запуска вашей модели в веб-браузере или приложении Node.JS.

Более сложные примеры

Представленный выше пример на самом деле предназначен только для начала. Ниже приведены некоторые примеры интеграции с другими облачными сервисами.

Попробуйте `BigQueryExampleGen`

BigQuery — это бессерверное, масштабируемое и экономичное облачное хранилище данных. BigQuery можно использовать в качестве источника обучающих примеров в TFX. На этом этапе мы добавим BigQueryExampleGen в конвейер.

В редакторе файлов Jupyter Lab:

Дважды щелкните, чтобы открыть pipeline.py . Закомментируйте CsvExampleGen и раскомментируйте строку, которая создает экземпляр BigQueryExampleGen . Вам также необходимо раскомментировать аргумент query функции create_pipeline .

Нам нужно указать, какой проект GCP использовать для BigQuery, и это делается путем установки --project в beam_pipeline_args при создании конвейера.

Дважды щелкните, чтобы открыть configs.py . Раскомментируйте определение BIG_QUERY_WITH_DIRECT_RUNNER_BEAM_PIPELINE_ARGS и BIG_QUERY_QUERY . Вам следует заменить идентификатор проекта и значение региона в этом файле правильными значениями для вашего проекта GCP.

Примечание. Прежде чем продолжить, НЕОБХОДИМО указать идентификатор и регион проекта GCP в файле configs.py .**

Измените каталог на уровень выше. Щелкните имя каталога над списком файлов. Имя каталога — это имя конвейера, то есть my_pipeline если вы не меняли имя конвейера.

Дважды щелкните, чтобы открыть kubeflow_runner.py . Раскомментируйте два аргумента, query и beam_pipeline_args для функции create_pipeline .

Теперь конвейер готов использовать BigQuery в качестве примера источника. Обновите конвейер, как раньше, и создайте новый запуск выполнения, как мы это делали на шагах 5 и 6.

Обновите конвейер и перезапустите его.

# Update the pipeline
!tfx pipeline update \
  --pipeline-path=kubeflow_runner.py \
  --endpoint={ENDPOINT}

!tfx run create --pipeline-name {PIPELINE_NAME} --endpoint={ENDPOINT}

Попробуйте поток данных

Некоторые компоненты TFX используют Apache Beam для реализации конвейеров с параллельными данными, а это означает, что вы можете распределять рабочие нагрузки по обработке данных с помощью Google Cloud Dataflow . На этом этапе мы настроим оркестратор Kubeflow на использование Dataflow в качестве серверной части обработки данных для Apache Beam.

Примечание. Если API Dataflow еще не включен, его можно включить с помощью консоли или из интерфейса командной строки с помощью этой команды (например, в Cloud Shell):

# Select your project:
gcloud config set project YOUR_PROJECT_ID

# Get a list of services that you can enable in your project:
gcloud services list --available | grep Dataflow

# If you don't see dataflow.googleapis.com listed, that means you haven't been
# granted access to enable the Dataflow API.  See your account adminstrator.

# Enable the Dataflow service:

gcloud services enable dataflow.googleapis.com

Примечание. Скорость выполнения может быть ограничена квотой Google Compute Engine (GCE) по умолчанию. Мы рекомендуем установить достаточную квоту примерно для 250 виртуальных машин Dataflow: 250 ЦП, 250 IP-адресов и 62 500 ГБ постоянного диска . Дополнительные сведения см. в документации по квотам GCE и квотам потока данных . Если вы заблокированы квотой IP-адреса, использование большего значения worker_type уменьшит количество необходимых IP-адресов.

Дважды щелкните pipeline , чтобы изменить каталог, и дважды щелкните, чтобы открыть configs.py . Раскомментируйте определения GOOGLE_CLOUD_REGION и DATAFLOW_BEAM_PIPELINE_ARGS .

Измените каталог на уровень выше. Щелкните имя каталога над списком файлов. Имя каталога — это имя конвейера, то есть my_pipeline если вы не меняли его.

Дважды щелкните, чтобы открыть kubeflow_runner.py . Раскомментируйте beam_pipeline_args . (Также обязательно закомментируйте текущий beam_pipeline_args , который вы добавили на шаге 7.)

Обновите конвейер и перезапустите его.

# Update the pipeline
!tfx pipeline update \
  --pipeline-path=kubeflow_runner.py \
  --endpoint={ENDPOINT}

!tfx run create --pipeline-name {PIPELINE_NAME} --endpoint={ENDPOINT}

Вы можете найти задания Dataflow в Dataflow в Cloud Console .

Попробуйте обучение и прогнозирование на платформе Cloud AI с помощью KFP

TFX взаимодействует с несколькими управляемыми сервисами GCP, такими как облачная платформа искусственного интеллекта для обучения и прогнозирования . Вы можете настроить свой компонент Trainer на использование Cloud AI Platform Training, управляемого сервиса для обучения моделей машинного обучения. Более того, когда ваша модель построена и готова к использованию, вы можете отправить ее в Cloud AI Platform Prediction для обслуживания. На этом этапе мы настроим наш компонент Trainer и Pusher на использование сервисов Cloud AI Platform.

Прежде чем редактировать файлы, вам, возможно, придется сначала включить AI Platform Training & Prediction API .

Дважды щелкните pipeline , чтобы изменить каталог, и дважды щелкните, чтобы открыть configs.py . Раскомментируйте определения GOOGLE_CLOUD_REGION , GCP_AI_PLATFORM_TRAINING_ARGS и GCP_AI_PLATFORM_SERVING_ARGS . Мы будем использовать наш специально созданный образ контейнера для обучения модели в обучении Cloud AI Platform, поэтому нам следует установить masterConfig.imageUri в GCP_AI_PLATFORM_TRAINING_ARGS то же значение, что и для CUSTOM_TFX_IMAGE выше.

Измените каталог на один уровень выше и дважды щелкните, чтобы открыть kubeflow_runner.py . Раскомментируйте ai_platform_training_args и ai_platform_serving_args .

Примечание. Если на этапе обучения вы получаете сообщение об ошибке разрешений, вам может потребоваться предоставить разрешения средства просмотра объектов хранилища для учетной записи службы Cloud Machine Learning Engine (AI Platform Prediction & Training). Дополнительную информацию можно найти в документации Container Registry .

Обновите конвейер и перезапустите его.

# Update the pipeline
!tfx pipeline update \
  --pipeline-path=kubeflow_runner.py \
  --endpoint={ENDPOINT}

!tfx run create --pipeline-name {PIPELINE_NAME} --endpoint={ENDPOINT}

Вы можете найти вакансии по обучению в разделе «Вакансии на платформе Cloud AI» . Если ваш конвейер завершился успешно, вы можете найти свою модель в разделе «Модели платформы Cloud AI» .

14. Используйте свои собственные данные

В этом уроке вы создали конвейер для модели, используя набор данных Chicago Taxi. Теперь попробуйте поместить в конвейер свои собственные данные. Ваши данные могут храниться везде, где конвейер может получить к ним доступ, включая Google Cloud Storage, BigQuery или файлы CSV.

Вам необходимо изменить определение конвейера, чтобы оно соответствовало вашим данным.

Если ваши данные хранятся в файлах

Измените DATA_PATH в kubeflow_runner.py , указав местоположение.

Если ваши данные хранятся в BigQuery

Измените BIG_QUERY_QUERY в configs.py на свой оператор запроса.
Добавьте функции в models / features.py .
Измените models / preprocessing.py , чтобы преобразовать входные данные для обучения .
Измените models / keras / model.py и models / keras / constants.py , чтобы описать вашу модель машинного обучения .

Узнать больше о тренере

Дополнительные сведения о конвейерах обучения см. в руководстве по компоненту Trainer .

Убираться

Чтобы очистить все ресурсы Google Cloud, используемые в этом проекте, вы можете удалить проект Google Cloud, который вы использовали в этом руководстве.

Кроме того, вы можете очистить отдельные ресурсы, посетив каждую консоль: - Google Cloud Storage - Google Container Registry - Google Kubernetes Engine.

TFX на конвейерах платформы облачного ИИ

Введение

Набор данных такси Чикаго

Цель модели — двоичная классификация

1. Настройте проект Google Cloud.

1.a Настройте свою среду в Google Cloud

1.б Создайте новый проект.

2. Настройка и развертывание конвейера платформы AI в новом кластере Kubernetes.

3. Настройте экземпляр Cloud AI Platform Notebook.

4. Запустите блокнот «Начало работы».

5. Продолжаем работать в Блокноте.

Установить

Подключитесь к своим облачным сервисам Google

6. Скопируйте шаблон в каталог вашего проекта.

Просмотрите файлы конвейера

7. Запустите свой первый конвейер TFX на Kubeflow.

Подключиться к хранилищу

Создайте конвейер

Запустите конвейер

8. Проверьте свои данные

Компоненты

В редакторе файлов Jupyter Lab:

Обновите конвейер и перезапустите его.

Проверьте трубопровод

Более продвинутый пример

9. Разработка функций

Компоненты

В редакторе файлов Jupyter Lab:

Обновите конвейер и перезапустите его.

Проверьте выходы конвейера

Более продвинутый пример

10. Обучение

Компоненты

В редакторе файлов Jupyter Lab:

Обновите конвейер и перезапустите его.

Проверьте выходы конвейера

Более продвинутый пример

11. Анализ производительности модели

Компоненты

В редакторе файлов Jupyter Lab:

Обновите конвейер и перезапустите его.

Проверьте выходы конвейера

12. Обслуживание модели

Компоненты

В редакторе файлов Jupyter Lab:

Проверьте выходы конвейера

Доступные цели развертывания

Более сложные примеры

Рекомендации по ресурсам Kubeflow Pipelines

Попробуйте BigQueryExampleGen

В редакторе файлов Jupyter Lab:

Обновите конвейер и перезапустите его.

Попробуйте поток данных

Обновите конвейер и перезапустите его.

Попробуйте обучение и прогнозирование на платформе Cloud AI с помощью KFP

Обновите конвейер и перезапустите его.

14. Используйте свои собственные данные

Если ваши данные хранятся в файлах

Если ваши данные хранятся в BigQuery

Узнать больше о тренере

Убираться

Попробуйте `BigQueryExampleGen`