このページは Cloud Translation API によって翻訳されました。
Switch to English

TensorFlowエージェント

TensorFlowによる強化学習

エージェントは、変更および拡張が可能な十分にテストされたモジュール式コンポーネントを提供することにより、新しいRLアルゴリズムの設計、実装、およびテストを容易にします。優れたテスト統合とベンチマークにより、コードの高速反復を可能にします。

開始するには、 チュートリアルの 1つを確認することをお勧めします。

取り付け

TF-Agentsは毎晩安定したビルドを公開しています。リリースのリストについては、 リリースのセクションをご覧ください。以下のコマンドは、 pypi.orgから、およびGitHubクローンからTF-Agentsを安定して毎晩インストールする方法をカバーしています。

安定した

以下のコマンドを実行して、最新の安定版リリースをインストールします。このリリースのAPIドキュメントはtensorflow.orgにあります。

$ pip install --user tf-agents[reverb]

# Use this tag get the matching examples and colabs.
$ git clone https://github.com/tensorflow/agents.git
$ cd agents
$ git checkout v0.6.0

pip依存関係チェックで互換性がないとフラグが付けられているTensorflowまたはReverbのバージョンでTF-Agentをインストールする場合は、自己責任で以下のパターンを使用してください。

$ pip install --user tensorflow
$ pip install --user dm-reverb
$ pip install --user tf-agents

TensorFlow 1.15または2.0でTF-Agentを使用する場合は、バージョン0.3.0をインストールします。

# Newer versions of tensorflow-probability require newer versions of TensorFlow.
$ pip install tensorflow-probability==0.8.0
$ pip install tf-agents==0.3.0

毎晩

ナイトリービルドには新しい機能が含まれていますが、バージョン付きのリリースよりも安定性が低い場合があります。ナイトリービルドはtf-agents-nightlyとしてプッシュされます。 TensorFlowのナイトリーバージョン( tf-nightly )とTensorFlow Probability( tfp-nightly )をインストールすることをお勧めします。これらはTF-Agentsが毎晩テストされるバージョンであるためです。

ナイトリービルドバージョンをインストールするには、次のコマンドを実行します。

# `--force-reinstall helps guarantee the right versions.
$ pip install --user --force-reinstall tf-nightly
$ pip install --user --force-reinstall tfp-nightly
$ pip install --user --force-reinstall dm-reverb-nightly

# Installing with the `--upgrade` flag ensures you'll get the latest version.
$ pip install --user --upgrade tf-agents-nightly

GitHubから

リポジトリのクローンを作成した後、 pip install -e .[tests]実行して依存関係をインストールできます。 TensorFlowは個別にpip install --user tf-nightly必要があります: pip install --user tf-nightly

貢献する

私たちはあなたと協力したいです!貢献方法のガイドについては、 CONTRIBUTING.mdを参照してください。このプロジェクトは、TensorFlowの行動規範に準拠しています。参加することにより、あなたはこのコードを守ることが期待されます。

リリース

TF Agentsは安定した夜間リリースを備えています。多くの場合、毎晩のリリースは問題ありませんが、上流のライブラリが流動的であるために問題が発生する可能性があります。以下の表は、TensorFlowの特定のバージョンにロックされている可能性があるユーザーを支援するために、各TFエージェントのリリースでテストされたTensorFlowのバージョンを示しています。

解放するブランチ/タグ TensorFlowバージョン
毎晩 主人 tf-nightly
0.6.0 v0.6.0 2.3.0
0.5.0 v0.5.0 2.2.0
0.4.0 v0.4.0 2.1.0
0.3.0 v0.3.0 1.15.0および2.0.0

原則

このプロジェクトは、 GoogleのAI原則に従っています 。このプロジェクトに参加、使用、または貢献することにより、これらの原則を順守することが期待されます。

引用

このコードを使用する場合は、次のように引用してください。

@misc{TFAgents,
  title = { {TF-Agents}: A library for Reinforcement Learning in TensorFlow},
  author = "{Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and
     Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and
     Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and
     Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and
     Vincent Vanhoucke and Eugene Brevdo}",
  howpublished = {\url{https://github.com/tensorflow/agents} },
  url = "https://github.com/tensorflow/agents",
  year = 2018,
  note = "[Online; accessed 25-June-2019]"
}