Apprentissage par renforcement avec TensorFlow
Agents facilite la conception, la mise en œuvre et le test de nouveaux algorithmes RL, en fournissant des composants modulaires bien testés qui peuvent être modifiés et étendus. Il permet une itération rapide du code, avec une bonne intégration des tests et une bonne analyse comparative.
Pour commencer, nous vous recommandons de consulter l'un de nos tutoriels .
Installation
TF-Agents publie des versions nocturnes et stables. Pour une liste des versions, lisez la section Releases . Les commandes ci-dessous couvrent l'installation de TF-Agents stable et nocturne à partir de pypi.org ainsi qu'à partir d'un clone GitHub.
Stable
Exécutez les commandes ci-dessous pour installer la version stable la plus récente. La documentation de l'API pour la version est sur tensorflow.org .
$ pip install --user tf-agents[reverb]
# Use this tag get the matching examples and colabs.
$ git clone https://github.com/tensorflow/agents.git
$ cd agents
$ git checkout v0.7.1
Si vous souhaitez installer TF-Agents avec des versions de Tensorflow ou de Reverb marquées comme non compatibles par la vérification de dépendance pip, utilisez le modèle suivant ci-dessous à vos propres risques.
$ pip install --user tensorflow
$ pip install --user dm-reverb
$ pip install --user tf-agents
Si vous souhaitez utiliser TF-Agents avec TensorFlow 1.15 ou 2.0, installez la version 0.3.0:
# Newer versions of tensorflow-probability require newer versions of TensorFlow.
$ pip install tensorflow-probability==0.8.0
$ pip install tf-agents==0.3.0
Chaque nuit
Les versions nocturnes incluent des fonctionnalités plus récentes, mais peuvent être moins stables que les versions versionnées. La version nocturne est poussée en tant que tf-agents-nightly
. Nous suggérons d'installer des versions nocturnes de TensorFlow ( tf-nightly
) et TensorFlow Probability ( tfp-nightly
) car ce sont les versions contre lesquelles TF-Agents est testé la nuit.
Pour installer la version nightly build, exécutez ce qui suit:
# `--force-reinstall helps guarantee the right versions.
$ pip install --user --force-reinstall tf-nightly
$ pip install --user --force-reinstall tfp-nightly
$ pip install --user --force-reinstall dm-reverb-nightly
# Installing with the `--upgrade` flag ensures you'll get the latest version.
$ pip install --user --upgrade tf-agents-nightly
Depuis GitHub
Après avoir cloné le référentiel, les dépendances peuvent être installées en exécutant pip install -e .[tests]
. TensorFlow doit être installé indépendamment: pip install --user tf-nightly
.
Contribuant
Nous sommes impatients de collaborer avec vous! Voir CONTRIBUTING.md
pour un guide sur la façon de contribuer. Ce projet adhère au code de conduite de TensorFlow. En participant, vous devez respecter ce code.
Communiqués
TF Agents a des versions stables et nocturnes. Les versions nocturnes sont souvent bonnes mais peuvent avoir des problèmes en raison du flux des bibliothèques en amont. Le tableau ci-dessous répertorie la ou les versions de TensorFlow testées avec la version de chaque agent TF pour aider les utilisateurs susceptibles d'être verrouillés dans une version spécifique de TensorFlow.
Libération | Branche / étiquette | Version de TensorFlow |
---|---|---|
Chaque nuit | Maître | tf tous les soirs |
0.7.1 | v0.7.1 | 2.4.0 |
0,6,0 | v0.6.0 | 2.3.0 |
0,5,0 | v0.5.0 | 2.2.0 |
0.4.0 | v0.4.0 | 2.1.0 |
0,3,0 | v0.3.0 | 1.15.0 et 2.0.0 |
Des principes
Ce projet adhère aux principes d'IA de Google . En participant, en utilisant ou en contribuant à ce projet, vous êtes censé adhérer à ces principes.
Citation
Si vous utilisez ce code, veuillez le citer comme suit:
@misc{TFAgents,
title = { {TF-Agents}: A library for Reinforcement Learning in TensorFlow},
author = {Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and
Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and
Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and
Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and
Vincent Vanhoucke and Eugene Brevdo},
howpublished = {\url{https://github.com/tensorflow/agents} },
url = "https://github.com/tensorflow/agents",
year = 2018,
note = "[Online; accessed 25-June-2019]"
}