Google I/O — это обертка! Наверстать упущенное в сеансах TensorFlow Просмотреть сеансы

Агенты TensorFlow

Обучение с подкреплением с TensorFlow

Агенты упрощают разработку, внедрение и тестирование новых алгоритмов RL, предоставляя проверенные модульные компоненты, которые можно модифицировать и расширять. Он обеспечивает быструю итерацию кода с хорошей интеграцией тестов и бенчмаркингом.

Для начала рекомендуем ознакомиться с одним из наших руководств .

Установка

TF-Agents публикует ночные и стабильные сборки. Список релизов читайте в разделе Релизы . Приведенные ниже команды охватывают стабильную и ночную установку TF-Agents с pypi.org , а также с клона GitHub.

Стабильный

Запустите приведенные ниже команды, чтобы установить самую последнюю стабильную версию. Документация по API для релиза есть на tensorflow.org .

$ pip install --user tf-agents[reverb]

# Use this tag get the matching examples and colabs.
$ git clone https://github.com/tensorflow/agents.git
$ cd agents
$ git checkout v0.12.0

Если вы хотите установить TF-Agents с версиями Tensorflow или Reverb , которые помечены как несовместимые проверкой зависимости pip, используйте следующий шаблон ниже на свой страх и риск.

$ pip install --user tensorflow
$ pip install --user dm-reverb
$ pip install --user tf-agents

Если вы хотите использовать TF-Agents с TensorFlow 1.15 или 2.0, установите версию 0.3.0:

# Newer versions of tensorflow-probability require newer versions of TensorFlow.
$ pip install tensorflow-probability==0.8.0
$ pip install tf-agents==0.3.0

Ночной

Ночные сборки включают новые функции, но могут быть менее стабильными, чем версионные версии. Ночная сборка отправляется как tf-agents-nightly . Мы предлагаем установить ночные версии TensorFlow ( tf-nightly ) и TensorFlow Probability ( tfp-nightly ), поскольку это версии, с которыми тестируются TF-Agents nightly.

Чтобы установить ночную версию сборки, выполните следующее:

# `--force-reinstall helps guarantee the right versions.
$ pip install --user --force-reinstall tf-nightly
$ pip install --user --force-reinstall tfp-nightly
$ pip install --user --force-reinstall dm-reverb-nightly

# Installing with the `--upgrade` flag ensures you'll get the latest version.
$ pip install --user --upgrade tf-agents-nightly

Из GitHub

После клонирования репозитория зависимости можно установить, запустив pip install -e .[tests] . TensorFlow нужно установить отдельно: pip install --user tf-nightly .

Содействие

Мы готовы сотрудничать с вами! См. CONTRIBUTING.md для руководства о том, как внести свой вклад. Этот проект придерживается кодекса поведения TensorFlow. Участвуя, вы должны соблюдать этот кодекс.

Релизы

TF Agents имеет стабильные и ночные версии. Ночные выпуски часто хороши, но могут иметь проблемы из-за того, что исходные библиотеки находятся в постоянном движении. В таблице ниже перечислены версии TensorFlow, протестированные с каждым выпуском агентов TF, чтобы помочь пользователям, которые могут быть привязаны к определенной версии TensorFlow.

Выпуск Филиал/тег Версия TensorFlow
Ночной владелец tf-ночной
0.12.0 v0.12.0 2.8.0
0.11.0 v0.11.0 2.7.0
0.10.0 v0.10.0 2.6.0
0.9.0 v0.9.0 2.6.0
0.8.0 v0.8.0 2.5.0
0.7.1 v0.7.1 2.4.0
0.6.0 v0.6.0 2.3.0
0.5.0 v0.5.0 2.2.0
0.4.0 v0.4.0 2.1.0
0.3.0 v0.3.0 1.15.0 и 2.0.0

Принципы

Этот проект придерживается принципов искусственного интеллекта Google . Участвуя, используя или внося свой вклад в этот проект, вы должны соблюдать эти принципы.

Цитата

Если вы используете этот код, указывайте его как:

@misc{TFAgents,
  title = { {TF-Agents}: A library for Reinforcement Learning in TensorFlow},
  author = {Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and
     Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and
     Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and
     Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and
     Vincent Vanhoucke and Eugene Brevdo},
  howpublished = {\url{https://github.com/tensorflow/agents} },
  url = "https://github.com/tensorflow/agents",
  year = 2018,
  note = "[Online; accessed 25-June-2019]"
}