Agen TensorFlow

Pembelajaran Penguatan dengan TensorFlow

Agen membuat perancangan, penerapan, dan pengujian algoritme RL baru menjadi lebih mudah, dengan menyediakan komponen modular yang teruji dengan baik yang dapat dimodifikasi dan diperluas. Ini memungkinkan iterasi kode yang cepat, dengan integrasi pengujian dan benchmarking yang baik.

Untuk memulai, kami sarankan untuk melihat salah satu tutorial kami .

Instalasi

TF-Agents menerbitkan build malam dan stabil. Untuk daftar rilis, baca bagian Rilis . Perintah di bawah ini mencakup penginstalan TF-Agents stable dan nightly dari pypi.org serta dari klon GitHub.

Stabil

Jalankan perintah di bawah ini untuk menginstal rilis stabil terbaru. Dokumentasi API untuk rilis ada di tensorflow.org .

$ pip install --user tf-agents[reverb]

# Use this tag get the matching examples and colabs.
$ git clone https://github.com/tensorflow/agents.git
$ cd agents
$ git checkout v0.13.0

Jika Anda ingin menginstal TF-Agents dengan versi Tensorflow atau Reverb yang ditandai sebagai tidak kompatibel dengan pemeriksaan ketergantungan pip, gunakan pola berikut dengan risiko Anda sendiri.

$ pip install --user tensorflow
$ pip install --user dm-reverb
$ pip install --user tf-agents

Jika Anda ingin menggunakan TF-Agents dengan TensorFlow 1.15 atau 2.0, instal versi 0.3.0:

# Newer versions of tensorflow-probability require newer versions of TensorFlow.
$ pip install tensorflow-probability==0.8.0
$ pip install tf-agents==0.3.0

Malam

Build nightly menyertakan fitur yang lebih baru, tetapi mungkin kurang stabil dibandingkan rilis berversi. Build nightly didorong sebagai tf-agents-nightly . Kami menyarankan untuk menginstal TensorFlow versi malam ( tf-nightly ) dan TensorFlow Probability ( tfp-nightly ) karena ini adalah versi yang diuji oleh TF-Agents setiap malam.

Untuk menginstal versi nightly build, jalankan yang berikut ini:

# `--force-reinstall helps guarantee the right versions.
$ pip install --user --force-reinstall tf-nightly
$ pip install --user --force-reinstall tfp-nightly
$ pip install --user --force-reinstall dm-reverb-nightly

# Installing with the `--upgrade` flag ensures you'll get the latest version.
$ pip install --user --upgrade tf-agents-nightly

Dari GitHub

Setelah mengkloning repositori, dependensi dapat diinstal dengan menjalankan pip install -e .[tests] . TensorFlow perlu diinstal secara independen: pip install --user tf-nightly .

Berkontribusi

Kami sangat ingin bekerja sama dengan Anda! Lihat CONTRIBUTING.md untuk panduan tentang cara berkontribusi. Proyek ini mematuhi kode etik TensorFlow . Dengan berpartisipasi, Anda diharapkan untuk menjunjung tinggi kode ini.

Rilis

TF Agents memiliki rilis yang stabil dan setiap malam. Rilis malam sering kali baik-baik saja tetapi dapat memiliki masalah karena perpustakaan hulu sedang berubah. Tabel di bawah mencantumkan versi TensorFlow yang diuji dengan setiap rilis Agen TF untuk membantu pengguna yang mungkin dikunci ke versi TensorFlow tertentu.

Melepaskan Cabang / Tag Versi TensorFlow
Malam menguasai malam-malam
0.13.0 v0.13.0 2.9.0
0.12.0 v0.12.0 2.8.0
0.11.0 v0.11.0 2.7.0
0.10.0 v0.10.0 2.6.0
0.9.0 v0.9.0 2.6.0
0.8.0 v0.8.0 2.5.0
0.7.1 v0.7.1 2.4.0
0.6.0 v0.6.0 2.3.0
0.5.0 v0.5.0 2.2.0
0.4.0 v0.4.0 2.1.0
0.3.0 v0.3.0 1.15.0 dan 2.0.0

Prinsip

Proyek ini mematuhi prinsip AI Google . Dengan berpartisipasi, menggunakan atau berkontribusi pada proyek ini, Anda diharapkan untuk mematuhi prinsip-prinsip ini.

Kutipan

Jika Anda menggunakan kode ini, harap kutip sebagai:

@misc{TFAgents,
  title = { {TF-Agents}: A library for Reinforcement Learning in TensorFlow},
  author = {Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and
     Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and
     Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and
     Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and
     Vincent Vanhoucke and Eugene Brevdo},
  howpublished = {\url{https://github.com/tensorflow/agents} },
  url = "https://github.com/tensorflow/agents",
  year = 2018,
  note = "[Online; accessed 25-June-2019]"
}