Diese Seite wurde von der Cloud Translation API übersetzt.
Switch to English

TensorFlow Agents

Verstärkung Lernen mit TensorFlow

Agents wird die Planung, Implementierung und Erprobung neuer RL-Algorithmen einfacher, von erprobten modularen Komponenten bereitstellt, die modifiziert und erweitert werden können. Es ermöglicht eine schnelle Code Iteration mit guter Test Integration und Benchmarking.

Um damit zu beginnen, empfehlen die Überprüfung wir einen unserer out - Tutorials .

Installation

TF-Agents veröffentlicht jede Nacht und stabil baut. Eine Liste der Veröffentlichungen lesen Sie die Veröffentlichungen Abschnitt. Die Befehle unter Abdeckung der Installation TF-Agents stabil und nächtliche von pypi.org sowie aus einem GitHub Klon.

Stabil

Führen Sie die Befehle unter die aktuellste stabile Version (0.5.0) zu installieren, die mit TensorFlow 2.2.x und Python3 getestet wurde.

 pip install --user tf-agents
pip install --user tensorflow==2.2.0

# To get the matching examples and colabs
git clone https://github.com/tensorflow/agents.git
cd agents
git checkout v0.5.0

 

Wenn Sie TF-Agenten mit TensorFlow 1.15 oder 2.0 verwenden möchten, installieren Sie Version 0.3.0:

 pip install tf-agents==0.3.0
# Newer versions of tensorflow-probability require newer versions of TensorFlow.
pip install tensorflow-probability==0.8.0
 

Nächtlich

Nightly Builds neuere Funktionen umfassen, jedoch weniger stabil sein als die versioniert Releases. Die Nightly Build wird als gedrückt tf-agents-nightly . Wir empfehlen die Installation von nächtlichen Versionen von TensorFlow ( tf-nightly ) und TensorFlow Wahrscheinlichkeit ( tfp-nightly ) ist wie die , die Version TF-Agents jede Nacht gegen getestet werden.

Um die Nightly-Build-Version zu installieren, führen Sie die folgende:

 # Installing with the `--upgrade` flag ensures you'll get the latest version.
pip install --user --upgrade tf-agents-nightly  # depends on tf-nightly
# `--force-reinstall helps guarantee the right version.
pip install --user --force-reinstall tf-nightly
pip install --user --force-reinstall tfp-nightly
 

von GitHub

Nachdem das Repository klonen, können die Abhängigkeiten durch Ausführen installiert werden pip install -e .[tests] . TensorFlow muss unabhängig installiert werden: pip install --user tf-nightly .

Beitragende

Wir sind eifrig, mit Ihnen zusammenzuarbeiten! Siehe CONTRIBUTING.md für eine Anleitung, wie man beizutragen. Dieses Projekt hält sich an TensorFlow des Verhaltenskodex . Durch die Teilnahme erwartet, dass Sie diesen Code zu wahren.

Veröffentlichungen

TF-Agenten haben stabile und nächtliche Versionen. Die nächtlichen Versionen sind oft gut, aber können Probleme haben aufgrund Upstream-Bibliotheken im Fluss zu sein. Die folgende Tabelle enthält die Version (en) von TensorFlow getestet mit jedem Release TF-Agenten zu helfen Benutzern, die in eine bestimmte Version von TensorFlow gesperrt werden kann.

Freisetzung Verzweigen / Markieren TensorFlow Version
Nächtlich Meister tf-nächtliche
0.5.0 v0.5.0 2.2.0
0.4.0 v0.4.0 2.1.0
0.3.0 v0.3.0 1.15.0 und 2.0.0

Beispiele für die Installation von nächtlichen, aktuellstes stabil, und eine bestimmte Version von TF-Agents:

 # Stable
pip install tf-agents

# Nightly
pip install tf-agents-nightly

# Specific version
pip install tf-agents==0.3.0

 

Principles

Dieses Projekt hält sich an den Google-AI Prinzipien . Durch die Teilnahme mit oder einem Beitrag zu diesem Projekt, das Sie erwarten, dass diese Grundsätze einzuhalten.

Zitat

Wenn Sie diesen Code verwenden, zitieren Sie es als:

 @misc{TFAgents,
  title = { {TF-Agents}: A library for Reinforcement Learning in TensorFlow},
  author = "{Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and
     Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and
     Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and
     Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and
     Vincent Vanhoucke and Eugene Brevdo}",
  howpublished = {\url{https://github.com/tensorflow/agents} },
  url = "https://github.com/tensorflow/agents",
  year = 2018,
  note = "[Online; accessed 25-June-2019]"
}