Cette page a été traduite par l'API Cloud Translation.
Switch to English

Agents TensorFlow

Apprentissage par renforcement avec TensorFlow

Agents facilite la conception, la mise en œuvre et le test de nouveaux algorithmes RL, en fournissant des composants modulaires bien testés qui peuvent être modifiés et étendus. Il permet une itération rapide du code, avec une bonne intégration des tests et une bonne analyse comparative.

Pour commencer, nous vous recommandons de consulter l'un de nos tutoriels .

Installation

TF-Agents publie des versions nocturnes et stables. Pour une liste des versions, lisez la section Releases . Les commandes ci-dessous couvrent l'installation de TF-Agents stable et nocturne à partir de pypi.org ainsi qu'à partir d'un clone GitHub.

Stable

Exécutez les commandes ci-dessous pour installer la version stable la plus récente. La documentation de l'API pour la version est sur tensorflow.org .

$ pip install --user tf-agents[reverb]

# Use this tag get the matching examples and colabs.
$ git clone https://github.com/tensorflow/agents.git
$ cd agents
$ git checkout v0.6.0

Si vous souhaitez installer TF-Agents avec des versions de Tensorflow ou Reverb marquées comme non compatibles par la vérification de dépendance pip, utilisez le modèle suivant ci-dessous à vos propres risques.

$ pip install --user tensorflow
$ pip install --user dm-reverb
$ pip install --user tf-agents

Si vous souhaitez utiliser TF-Agents avec TensorFlow 1.15 ou 2.0, installez la version 0.3.0:

# Newer versions of tensorflow-probability require newer versions of TensorFlow.
$ pip install tensorflow-probability==0.8.0
$ pip install tf-agents==0.3.0

Chaque nuit

Les versions nocturnes incluent des fonctionnalités plus récentes, mais peuvent être moins stables que les versions versionnées. Le build de nuit est poussé comme tf-agents-nightly . Nous vous suggérons d'installer des versions nocturnes de TensorFlow ( tf-nightly ) et TensorFlow Probability ( tfp-nightly ) car ce sont les versions contre lesquelles TF-Agents est testé la nuit.

Pour installer la version nightly build, exécutez ce qui suit:

# `--force-reinstall helps guarantee the right versions.
$ pip install --user --force-reinstall tf-nightly
$ pip install --user --force-reinstall tfp-nightly
$ pip install --user --force-reinstall dm-reverb-nightly

# Installing with the `--upgrade` flag ensures you'll get the latest version.
$ pip install --user --upgrade tf-agents-nightly

Depuis GitHub

Après avoir cloné le référentiel, les dépendances peuvent être installées en exécutant pip install -e .[tests] . TensorFlow doit être installé indépendamment: pip install --user tf-nightly .

Contribuant

Nous sommes impatients de collaborer avec vous! Voir CONTRIBUTING.md pour un guide sur la façon de contribuer. Ce projet adhère au code de conduite de TensorFlow. En participant, vous devez respecter ce code.

Communiqués

TF Agents a des versions stables et nocturnes. Les versions nocturnes sont souvent bonnes mais peuvent avoir des problèmes en raison du flux des bibliothèques en amont. Le tableau ci-dessous répertorie la ou les versions de TensorFlow testées avec la version de chaque agent TF pour aider les utilisateurs susceptibles d'être verrouillés dans une version spécifique de TensorFlow.

Libération Branche / étiquette Version de TensorFlow
Chaque nuit Maître tf tous les soirs
0,6,0 v0.6.0 2.3.0
0,5,0 v0.5.0 2.2.0
0.4.0 v0.4.0 2.1.0
0,3,0 v0.3.0 1.15.0 et 2.0.0

Des principes

Ce projet adhère aux principes d'IA de Google . En participant, en utilisant ou en contribuant à ce projet, vous êtes censé adhérer à ces principes.

Citation

Si vous utilisez ce code, veuillez le citer comme suit:

@misc{TFAgents,
  title = { {TF-Agents}: A library for Reinforcement Learning in TensorFlow},
  author = {Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and
     Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and
     Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and
     Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and
     Vincent Vanhoucke and Eugene Brevdo},
  howpublished = {\url{https://github.com/tensorflow/agents} },
  url = "https://github.com/tensorflow/agents",
  year = 2018,
  note = "[Online; accessed 25-June-2019]"
}