Помогают защитить Большой Барьерный Риф с TensorFlow на Kaggle Присоединяйтесь вызов

Агенты TensorFlow

Обучение с подкреплением с помощью TensorFlow

Агенты упрощают разработку, внедрение и тестирование новых алгоритмов RL, предоставляя хорошо протестированные модульные компоненты, которые можно изменять и расширять. Это обеспечивает быструю итерацию кода с хорошей интеграцией тестов и сравнительным анализом.

Для начала, мы рекомендуем проверить один из наших учебников .

Установка

TF-Agents публикует еженощные и стабильные сборки. Список релизов читать Releases раздел. Команды ниже крышка установка TF-агенты стабильных и ночью от pypi.org , а также из клона GitHub.

Стабильный

Выполните приведенные ниже команды, чтобы установить самый последний стабильный выпуск. API документация для выпуска на tensorflow.org .

$ pip install --user tf-agents[reverb]

# Use this tag get the matching examples and colabs.
$ git clone https://github.com/tensorflow/agents.git
$ cd agents
$ git checkout v0.11.0

Если вы хотите установить TF-агентов с версиями Tensorflow или Reverb , которые помечены не совместимы чеком зависимости пип, используйте следующий рисунок ниже на свой страх и риск.

$ pip install --user tensorflow
$ pip install --user dm-reverb
$ pip install --user tf-agents

Если вы хотите использовать TF-Agents с TensorFlow 1.15 или 2.0, установите версию 0.3.0:

# Newer versions of tensorflow-probability require newer versions of TensorFlow.
$ pip install tensorflow-probability==0.8.0
$ pip install tf-agents==0.3.0

По ночам

Ночные сборки включают новые функции, но могут быть менее стабильными, чем выпуски с поддержкой версий. Ночные сборки проталкивается в качестве tf-agents-nightly . Мы предлагаем установить ночные версии TensorFlow ( tf-nightly ) и TensorFlow вероятности ( tfp-nightly ) , как те версии TF-агенты по ночам испытаны против.

Чтобы установить версию для ночной сборки, выполните следующее:

# `--force-reinstall helps guarantee the right versions.
$ pip install --user --force-reinstall tf-nightly
$ pip install --user --force-reinstall tfp-nightly
$ pip install --user --force-reinstall dm-reverb-nightly

# Installing with the `--upgrade` flag ensures you'll get the latest version.
$ pip install --user --upgrade tf-agents-nightly

Из GitHub

После клонирования репозитория, зависимостей можно установить, запустив pip install -e .[tests] . TensorFlow должен быть установлен независимо друг от друга: pip install --user tf-nightly .

Содействие

Мы рады сотрудничать с вами! См CONTRIBUTING.md для руководства о том , как внести свой вклад. Этот проект придерживается TensorFlow в кодекс поведения . Участвуя, вы должны соблюдать этот кодекс.

Релизы

У TF Agents есть стабильные и ночные выпуски. Ночные выпуски часто хороши, но могут иметь проблемы из-за того, что библиотеки апстрима постоянно меняются. В таблице ниже перечислены версии TensorFlow, протестированные с каждым выпуском агентов TF, чтобы помочь пользователям, которые могут быть заблокированы в определенной версии TensorFlow.

Выпускать Филиал / Тег Версия TensorFlow
По ночам мастер tf-nightly
0.11.0 v0.11.0 2.7.0
0.10.0 v0.10.0 2.6.0
0.9.0 v0.9.0 2.6.0
0.8.0 v0.8.0 2.5.0
0.7.1 v0.7.1 2.4.0
0.6.0 v0.6.0 2.3.0
0.5.0 v0.5.0 2.2.0
0.4.0 v0.4.0 2.1.0
0.3.0 v0.3.0 1.15.0 и 2.0.0

Принципы

Этот проект придерживается принципов искусственного интеллекта компании Google . Ожидается, что, участвуя, используя или внося свой вклад в этот проект, вы будете придерживаться этих принципов.

Цитирование

Если вы используете этот код, укажите его как:

@misc{TFAgents,
  title = { {TF-Agents}: A library for Reinforcement Learning in TensorFlow},
  author = {Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and
     Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and
     Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and
     Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and
     Vincent Vanhoucke and Eugene Brevdo},
  howpublished = {\url{https://github.com/tensorflow/agents} },
  url = "https://github.com/tensorflow/agents",
  year = 2018,
  note = "[Online; accessed 25-June-2019]"
}