Agenty TensorFlow

Zadbaj o dobrą organizację dzięki kolekcji Zapisuj i kategoryzuj treści zgodnie ze swoimi preferencjami.

Nauka wzmacniania z TensorFlow

Agenty ułatwiają projektowanie, wdrażanie i testowanie nowych algorytmów RL, dostarczając dobrze przetestowane modułowe komponenty, które można modyfikować i rozszerzać. Umożliwia szybką iterację kodu, z dobrą integracją testów i benchmarkingiem.

Na początek zalecamy zapoznanie się z jednym z naszych samouczków .

Instalacja

TF-Agents publikuje nocne i stabilne wersje. Aby uzyskać listę wydań, przeczytaj sekcję Wydania . Poniższe polecenia obejmują instalację TF-Agents w wersji stabilnej i nocnej z pypi.org , a także z klonu GitHub.

Stabilny

Uruchom poniższe polecenia, aby zainstalować najnowszą stabilną wersję. Dokumentacja API do wydania znajduje się na tensorflow.org .

$ pip install --user tf-agents[reverb]

# Use this tag get the matching examples and colabs.
$ git clone https://github.com/tensorflow/agents.git
$ cd agents
$ git checkout v0.14.0

Jeśli chcesz zainstalować TF-Agents z wersjami Tensorflow lub Reverb , które są oznaczone jako niezgodne przez sprawdzenie zależności pip, użyj poniższego wzoru na własne ryzyko.

$ pip install --user tensorflow
$ pip install --user dm-reverb
$ pip install --user tf-agents

Jeśli chcesz używać TF-Agents z TensorFlow 1.15 lub 2.0, zainstaluj wersję 0.3.0:

# Newer versions of tensorflow-probability require newer versions of TensorFlow.
$ pip install tensorflow-probability==0.8.0
$ pip install tf-agents==0.3.0

Nocny

Kompilacje Nightly zawierają nowsze funkcje, ale mogą być mniej stabilne niż wersje wersjonowane. Wersja nightly jest przesuwana jako tf-agents-nightly . Sugerujemy zainstalowanie nocnych wersji TensorFlow ( tf-nightly ) i TensorFlow Probability ( tfp-nightly ), ponieważ są to wersje testowe TF-Agents nightly.

Aby zainstalować nocną wersję kompilacji, uruchom następujące polecenie:

# `--force-reinstall helps guarantee the right versions.
$ pip install --user --force-reinstall tf-nightly
$ pip install --user --force-reinstall tfp-nightly
$ pip install --user --force-reinstall dm-reverb-nightly

# Installing with the `--upgrade` flag ensures you'll get the latest version.
$ pip install --user --upgrade tf-agents-nightly

Z GitHub

Po sklonowaniu repozytorium zależności można zainstalować, uruchamiając pip install -e .[tests] . TensorFlow należy zainstalować niezależnie: pip install --user tf-nightly .

Przyczynianie się

Zapraszamy do współpracy! Zobacz CONTRIBUTING.md , aby dowiedzieć się, jak wnieść swój wkład. Ten projekt jest zgodny z kodeksem postępowania TensorFlow. Biorąc udział, oczekuje się, że będziesz przestrzegać tego kodu.

Wydania

TF Agents ma stabilne i nocne wydania. Conocne wydania są często w porządku, ale mogą powodować problemy z powodu zmian w bibliotekach nadrzędnych. Poniższa tabela zawiera listę wersji TensorFlow przetestowanych z każdym wydaniem agentów TF, aby pomóc użytkownikom, którzy mogą być zablokowani w określonej wersji TensorFlow.

Wydanie Oddział / Tag Wersja TensorFlow
Nocny gospodarz tf-nocny
0.14.0 v0.14.0 2.10.0
0,13,0 v0.13.0 2.9.0
0.12.0 v0.12.0 2.8.0
0.11.0 v0.11.0 2.7.0
0.10.0 v0.10.0 2.6.0
0.9.0 v0.9.0 2.6.0
0.8.0 v0.8.0 2.5.0
0.7.1 v0.7.1 2.4.0
0.6.0 v0.6.0 2.3.0
0,50 v0.5.0 2.2.0
0.4.0 v0.4.0 2.1.0
0.3.0 v0.3.0 1.15.0 i 2.0.0

Zasady

Ten projekt jest zgodny z zasadami AI Google . Oczekuje się, że uczestnicząc, korzystając lub przyczyniając się do tego projektu będziesz przestrzegać tych zasad.

Cytat

Jeśli używasz tego kodu, zacytuj go jako:

@misc{TFAgents,
  title = { {TF-Agents}: A library for Reinforcement Learning in TensorFlow},
  author = {Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and
     Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and
     Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and
     Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and
     Vincent Vanhoucke and Eugene Brevdo},
  howpublished = {\url{https://github.com/tensorflow/agents} },
  url = "https://github.com/tensorflow/agents",
  year = 2018,
  note = "[Online; accessed 25-June-2019]"
}