此页面由 Cloud Translation API 翻译。
Switch to English

TensorFlow代理

使用TensorFlow进行强化学习

通过提供可以修改和扩展的经过良好测试的模块化组件,Agents使设计,实施和测试新的RL算法变得更加容易。它具有良好的测试集成和基准测试,可实现快速代码迭代。

首先,我们建议您阅读我们的教程之一

安装

TF-Agents每晚发布稳定版本。有关发行列表,请阅读“ 发行”部分。下面的命令涵盖了从pypi.org和GitHub克隆稳定且每晚安装TF-Agents。

稳定

运行以下命令以安装最新的稳定版本。该版本的API文档位于tensorflow.org上

4

如果要安装带有pip依赖项检查标记为不兼容的Tensorflow或Reverb版本的TF-Agent,请自行承担以下风险。

$ pip install --user tensorflow
$ pip install --user dm-reverb
$ pip install --user tf-agents

如果要将TF-Agent与TensorFlow 1.15或2.0一起使用,请安装版本0.3.0:

# Newer versions of tensorflow-probability require newer versions of TensorFlow.
$ pip install tensorflow-probability==0.8.0
$ pip install tf-agents==0.3.0

每夜

每晚构建包含较新的功能,但可能不如版本发布稳定。每晚的构建按tf-agents-nightly推送。我们建议安装每晚版本的TensorFlow( tf-nightly )和TensorFlow概率( tfp-nightly ),因为它们是TF-Agents每晚测试的版本。

要安装夜间版本,请运行以下命令:

第61章98620

来自GitHub

克隆存储库后,可以通过运行pip install -e .[tests]来安装依赖项。 TensorFlow需要独立安装: pip install --user tf-nightly

贡献

我们渴望与您合作!有关如何贡献的指南,请参见CONTRIBUTING.md 。该项目遵守TensorFlow的行为准则 。通过参与,您将遵守此代码。

发布

TF Agents稳定且每晚发布。夜间发布通常很好,但是由于上游库不断变化,可能会出现问题。下表列出了在每个TF代理发行版中测试过的TensorFlow版本,以帮助可能被锁定在TensorFlow特定版本中的用户。

释放分行/标签 TensorFlow版本
每夜 每晚
0.6.0 v0.6.0 2.3.0
0.5.0 v0.5.0 2.2.0
0.4.0 v0.4.0 2.1.0
0.3.0 v0.3.0 1.15.0和2.0.0

原则

该项目遵循Google的AI原则 。通过参与,使用或为该项目做出贡献,您将遵守这些原则。

引文

如果您使用此代码,请引用为:

@misc{TFAgents,
  title = { {TF-Agents}: A library for Reinforcement Learning in TensorFlow},
  author = "{Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and
     Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and
     Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and
     Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and
     Vincent Vanhoucke and Eugene Brevdo}",
  howpublished = {\url{https://github.com/tensorflow/agents} },
  url = "https://github.com/tensorflow/agents",
  year = 2018,
  note = "[Online; accessed 25-June-2019]"
}