Эта страница была переведа с помощью Cloud Translation API.
Switch to English

Агенты TensorFlow

Обучение с подкреплением с TensorFlow

Агенты упрощают разработку, внедрение и тестирование новых алгоритмов RL, предоставляя хорошо протестированные модульные компоненты, которые можно изменять и расширять. Это обеспечивает быструю итерацию кода с хорошей интеграцией тестов и сравнительным анализом.

Для начала рекомендуем ознакомиться с одним из наших руководств .

Установка

TF-Agents публикует еженощные и стабильные сборки. Список выпусков см. В разделе « Выпуски ». Приведенные ниже команды описывают установку стабильных и еженощных TF-Agents с pypi.org, а также из клона GitHub.

Стабильный

Выполните приведенные ниже команды, чтобы установить самый последний стабильный выпуск. Документация по API для выпуска находится на сайте tensorflow.org .

$ pip install --user tf-agents[reverb]

# Use this tag get the matching examples and colabs.
$ git clone https://github.com/tensorflow/agents.git
$ cd agents
$ git checkout v0.6.0

Если вы хотите установить TF-Agents с версиями Tensorflow или Reverb , которые отмечены как несовместимые при проверке зависимостей, используйте следующий шаблон на свой страх и риск.

$ pip install --user tensorflow
$ pip install --user dm-reverb
$ pip install --user tf-agents

Если вы хотите использовать TF-Agents с TensorFlow 1.15 или 2.0, установите версию 0.3.0:

# Newer versions of tensorflow-probability require newer versions of TensorFlow.
$ pip install tensorflow-probability==0.8.0
$ pip install tf-agents==0.3.0

По ночам

Ночные сборки включают новые функции, но могут быть менее стабильными, чем выпуски с поддержкой версий. Ночная сборка продвигается как tf-agents-nightly . Мы предлагаем установить ночные версии TensorFlow ( tf-nightly ) и TensorFlow Probability ( tfp-nightly ), поскольку именно с этими версиями тестируются TF-Agents tfp-nightly .

Чтобы установить версию для ночной сборки, запустите следующее:

# `--force-reinstall helps guarantee the right versions.
$ pip install --user --force-reinstall tf-nightly
$ pip install --user --force-reinstall tfp-nightly
$ pip install --user --force-reinstall dm-reverb-nightly

# Installing with the `--upgrade` flag ensures you'll get the latest version.
$ pip install --user --upgrade tf-agents-nightly

Из GitHub

После клонирования репозитория зависимости можно установить, выполнив команду pip install -e .[tests] . TensorFlow необходимо установить отдельно: pip install --user tf-nightly .

Содействие

Мы рады сотрудничать с вами! CONTRIBUTING.md чтобы узнать, как внести свой вклад. Этот проект придерживается кодекса поведения TensorFlow. Участвуя, вы должны соблюдать этот кодекс.

Релизы

У TF Agents есть стабильные и ночные выпуски. Ночные выпуски часто хороши, но могут иметь проблемы из-за того, что библиотеки апстрима постоянно меняются. В таблице ниже перечислены версии TensorFlow, протестированные с каждым выпуском агентов TF, чтобы помочь пользователям, которые могут быть заблокированы в определенной версии TensorFlow.

Релиз Филиал / Тег Версия TensorFlow
По ночам мастер tf-nightly
0.6.0 v0.6.0 2.3.0
0.5.0 v0.5.0 2.2.0
0.4.0 v0.4.0 2.1.0
0.3.0 v0.3.0 1.15.0 и 2.0.0

Принципы

Этот проект придерживается принципов искусственного интеллекта Google . Ожидается, что, участвуя, используя или внося свой вклад в этот проект, вы будете придерживаться этих принципов.

Цитирование

Если вы используете этот код, укажите его как:

@misc{TFAgents,
  title = { {TF-Agents}: A library for Reinforcement Learning in TensorFlow},
  author = {Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and
     Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and
     Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and
     Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and
     Vincent Vanhoucke and Eugene Brevdo},
  howpublished = {\url{https://github.com/tensorflow/agents} },
  url = "https://github.com/tensorflow/agents",
  year = 2018,
  note = "[Online; accessed 25-June-2019]"
}