Diese Seite wurde von der Cloud Translation API übersetzt.
Switch to English

TensorFlow-Agenten

Verstärkungslernen mit TensorFlow

Agenten erleichtern das Entwerfen, Implementieren und Testen neuer RL-Algorithmen, indem sie gut getestete modulare Komponenten bereitstellen, die modifiziert und erweitert werden können. Es ermöglicht eine schnelle Code-Iteration mit guter Testintegration und Benchmarking.

Wir empfehlen, zunächst eines unserer Tutorials zu lesen .

Installation

TF-Agents veröffentlicht nächtliche und stabile Builds. Eine Liste der Releases finden Sie im Abschnitt Releases . Die folgenden Befehle behandeln die stabile und nächtliche Installation von TF-Agents von pypi.org sowie von einem GitHub-Klon.

Stabil

Führen Sie die folgenden Befehle aus, um die neueste stabile Version zu installieren. Die API-Dokumentation für die Version finden Sie auf tensorflow.org .

$ pip install --user tf-agents[reverb]

# Use this tag get the matching examples and colabs.
$ git clone https://github.com/tensorflow/agents.git
$ cd agents
$ git checkout v0.6.0

Wenn Sie TF-Agents mit Versionen von Tensorflow oder Reverb installieren möchten, die bei der Überprüfung der Pip-Abhängigkeit als nicht kompatibel gekennzeichnet sind, verwenden Sie das folgende Muster auf eigenes Risiko.

$ pip install --user tensorflow
$ pip install --user dm-reverb
$ pip install --user tf-agents

Wenn Sie TF-Agents mit TensorFlow 1.15 oder 2.0 verwenden möchten, installieren Sie Version 0.3.0:

# Newer versions of tensorflow-probability require newer versions of TensorFlow.
$ pip install tensorflow-probability==0.8.0
$ pip install tf-agents==0.3.0

Nächtlich

Nächtliche Builds enthalten neuere Funktionen, sind jedoch möglicherweise weniger stabil als die versionierten Versionen. Der nächtliche Build wird als tf-agents-nightly geschoben. Wir empfehlen, nächtliche Versionen von TensorFlow ( tf-nightly ) und TensorFlow Probability ( tfp-nightly ) zu tfp-nightly da dies die Versionen sind, gegen die TF-Agents Nightly getestet werden.

Führen Sie Folgendes aus, um die nächtliche Build-Version zu installieren:

# `--force-reinstall helps guarantee the right versions.
$ pip install --user --force-reinstall tf-nightly
$ pip install --user --force-reinstall tfp-nightly
$ pip install --user --force-reinstall dm-reverb-nightly

# Installing with the `--upgrade` flag ensures you'll get the latest version.
$ pip install --user --upgrade tf-agents-nightly

Von GitHub

Nach dem Klonen des Repositorys können die Abhängigkeiten installiert werden, indem pip install -e .[tests] . TensorFlow muss unabhängig installiert werden: pip install --user tf-nightly .

Mitwirken

Wir freuen uns, mit Ihnen zusammenzuarbeiten! Unter CONTRIBUTING.md eine Anleitung, wie Sie einen Beitrag leisten können. Dieses Projekt entspricht dem Verhaltenskodex von TensorFlow. Durch Ihre Teilnahme wird von Ihnen erwartet, dass Sie diesen Code einhalten.

Veröffentlichungen

TF Agents hat stabile und nächtliche Releases. Die nächtlichen Veröffentlichungen sind oft in Ordnung, können jedoch Probleme verursachen, da vorgelagerte Bibliotheken im Fluss sind. In der folgenden Tabelle sind die Versionen von TensorFlow aufgeführt, die mit den einzelnen TF Agents-Versionen getestet wurden, um Benutzern zu helfen, die möglicherweise an eine bestimmte Version von TensorFlow gebunden sind.

Veröffentlichung Zweig / Tag TensorFlow-Version
Nächtlich Meister tf-jeden Abend
0.6.0 v0.6.0 2.3.0
0,5,0 v0.5.0 2.2.0
0.4.0 v0.4.0 2.1.0
0.3.0 v0.3.0 1.15.0 und 2.0.0

Prinzipien

Dieses Projekt entspricht den KI-Prinzipien von Google . Wenn Sie an diesem Projekt teilnehmen, es nutzen oder dazu beitragen, wird von Ihnen erwartet, dass Sie diese Grundsätze einhalten.

Zitat

Wenn Sie diesen Code verwenden, zitieren Sie ihn bitte als:

@misc{TFAgents,
  title = { {TF-Agents}: A library for Reinforcement Learning in TensorFlow},
  author = {Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and
     Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and
     Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and
     Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and
     Vincent Vanhoucke and Eugene Brevdo},
  howpublished = {\url{https://github.com/tensorflow/agents} },
  url = "https://github.com/tensorflow/agents",
  year = 2018,
  note = "[Online; accessed 25-June-2019]"
}