本頁面由 Cloud Translation API 翻譯而成。
Switch to English

TensorFlow代理

使用TensorFlow進行強化學習

通過提供可修改和擴展的經過良好測試的模塊化組件,Agents使設計,實施和測試新的RL算法變得更加容易。它具有良好的測試集成和基準測試,可實現快速代碼迭代。

首先,我們建議您閱讀我們的教程之一

安裝

TF-Agents每晚發布穩定版本。有關發行列表,請閱讀“ 發行”部分。下面的命令涵蓋了從pypi.org和GitHub克隆穩定且每晚安裝TF-Agents。

穩定

運行以下命令以安裝最新的穩定版本(0.5.0),該版本已通過TensorFlow 2.2.x和Python3進行了測試。

 pip install --user tf-agents
pip install --user tensorflow==2.2.0

# To get the matching examples and colabs
git clone https://github.com/tensorflow/agents.git
cd agents
git checkout v0.5.0

 

如果要將TF-Agent與TensorFlow 1.15或2.0一起使用,請安裝版本0.3.0:

 pip install tf-agents==0.3.0
# Newer versions of tensorflow-probability require newer versions of TensorFlow.
pip install tensorflow-probability==0.8.0
 

每夜

每晚構建包含較新的功能,但可能不如版本發布穩定。每晚的構建按tf-agents-nightly推送。我們建議安裝每晚版本的TensorFlow( tf-nightly )和TensorFlow概率( tfp-nightly ),因為它們是每晚測試TF-Agents的版本。

要安裝夜間版本,請運行以下命令:

 # Installing with the `--upgrade` flag ensures you'll get the latest version.
pip install --user --upgrade tf-agents-nightly  # depends on tf-nightly
# `--force-reinstall helps guarantee the right version.
pip install --user --force-reinstall tf-nightly
pip install --user --force-reinstall tfp-nightly
 

來自GitHub

克隆存儲庫後,可以通過運行pip install -e .[tests]來安裝依賴項。 TensorFlow需要獨立安裝: pip install --user tf-nightly

貢獻

我們渴望與您合作!有關如何貢獻的指南,請參見CONTRIBUTING.md 。該項目遵守TensorFlow的行為準則 。通過參與,您將遵守此代碼。

發布

TF Agents穩定且每晚發布。夜間發布通常很好,但是由於上游庫不斷變化,可能會出現問題。下表列出了在每個TF代理髮行版中測試過的TensorFlow版本,以幫助可能被鎖定在TensorFlow特定版本中的用戶。

釋放分行/標籤 TensorFlow版本
每夜 每晚
0.5.0 v0.5.0 2.2.0
0.4.0 v0.4.0 2.1.0
0.3.0 v0.3.0 1.15.0和2.0.0

每晚安裝,最新的穩定版以及特定版本的TF-Agent的示例:

 # Stable
pip install tf-agents

# Nightly
pip install tf-agents-nightly

# Specific version
pip install tf-agents==0.3.0

 

原則

該項目遵循Google的AI原則 。通過參與,使用或為該項目做出貢獻,您將遵守這些原則。

引文

如果您使用此代碼,請引用為:

 @misc{TFAgents,
  title = { {TF-Agents}: A library for Reinforcement Learning in TensorFlow},
  author = "{Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and
     Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and
     Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and
     Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and
     Vincent Vanhoucke and Eugene Brevdo}",
  howpublished = {\url{https://github.com/tensorflow/agents} },
  url = "https://github.com/tensorflow/agents",
  year = 2018,
  note = "[Online; accessed 25-June-2019]"
}