TensorFlow ile Takviyeli Öğrenim
Aracılar, değiştirilebilen ve genişletilebilen iyi test edilmiş modüler bileşenler sağlayarak yeni RL algoritmalarının tasarlanmasını, uygulanmasını ve test edilmesini kolaylaştırır. İyi test entegrasyonu ve kıyaslama ile hızlı kod yinelemesine olanak tanır.
Başlamak için eğitimlerimizden birine göz atmanızı öneririz.
Kurulum
TF-Agents, her gece ve kararlı derlemeler yayınlar. Sürümlerin listesi için Sürümler bölümünü okuyun. Aşağıdaki komutlar, TF-Agent'ların istikrarlı ve her gece pypi.org'dan ve bir GitHub klonundan yüklenmesini kapsar.
:uyarı: Çok yaygın olan Reverb (tekrar oynatma arabelleği) kullanılıyorsa, TF-Agent'lar yalnızca Linux ile çalışacaktır.
Stabil
En son kararlı sürümü yüklemek için aşağıdaki komutları çalıştırın. Sürüm için API belgeleri tensorflow.org adresindedir.
$ pip install --user tf-agents[reverb]
# Use this tag get the matching examples and colabs.
$ git clone https://github.com/tensorflow/agents.git
$ cd agents
$ git checkout v0.15.0
Pip bağımlılık kontrolü tarafından uyumlu olmadığı işaretlenen Tensorflow veya Reverb sürümleriyle TF-Agent'ları yüklemek istiyorsanız, aşağıdaki kalıbı kullanın ve riski size aittir.
$ pip install --user tensorflow
$ pip install --user dm-reverb
$ pip install --user tf-agents
TF-Agent'ları TensorFlow 1.15 veya 2.0 ile kullanmak istiyorsanız 0.3.0 sürümünü yükleyin:
# Newer versions of tensorflow-probability require newer versions of TensorFlow.
$ pip install tensorflow-probability==0.8.0
$ pip install tf-agents==0.3.0
her gece
Gecelik sürümler daha yeni özellikler içerir, ancak sürümlenmiş yayınlardan daha az kararlı olabilir. Gecelik yapı tf-agents-nightly
olarak aktarılır. TensorFlow ( tf-nightly
) ve TensorFlow Probability'nin ( tfp-nightly
) gecelik sürümlerini yüklemenizi öneririz çünkü bunlar, TF-Agent'ların her gece test edildiği sürümlerdir.
Nightly derleme sürümünü yüklemek için aşağıdakileri çalıştırın:
# `--force-reinstall helps guarantee the right versions.
$ pip install --user --force-reinstall tf-nightly
$ pip install --user --force-reinstall tfp-nightly
$ pip install --user --force-reinstall dm-reverb-nightly
# Installing with the `--upgrade` flag ensures you'll get the latest version.
$ pip install --user --upgrade tf-agents-nightly
GitHub'dan
Depoyu klonladıktan sonra, bağımlılıklar pip install -e .[tests]
çalıştırılarak kurulabilir. TensorFlow'un bağımsız olarak kurulması gerekir: pip install --user tf-nightly
.
Katkı
Sizinle işbirliği yapmak için can atıyoruz! Nasıl katkıda bulunacağınızla ilgili bir kılavuz için CONTRIBUTING.md
bakın. Bu proje, TensorFlow'un davranış kurallarına uygundur. Katılarak, bu kuralı korumanız beklenir.
Salıverme
TF Agents'ın kararlı ve gecelik sürümleri vardır. Gecelik sürümler genellikle iyidir, ancak yukarı akış kitaplıklarının akış halinde olması nedeniyle sorunlar olabilir. Aşağıdaki tablo, her bir TF Aracısının sürümüyle uyumlu olan TensorFlow sürümlerini listeler. İlgilenilen yayın sürümleri:
- 0.16.0, Python 3.11'i destekleyen ilk sürümdür.
- 0.15.0, Python 3.7 ile uyumlu son sürümdür.
- Numpy < 1.19 kullanılıyorsa, TF-Agents 0.15.0 veya önceki sürümünü kullanın.
- 0.9.0, Python 3.6 ile uyumlu son sürümdür.
- 0.3.0, Python 2.x ile uyumlu son sürümdür.
Serbest bırakmak | Şube / Etiket | TensorFlow Sürümü | dm-reverb Sürümü |
---|---|---|---|
her gece | usta | tf-gecelik | dm-yankı-gecelik |
0.16.0 | v0.16.0 | 2.12.0 | 0.11.0 |
0.15.0 | v0.15.0 | 2.11.0 | 0.10.0 |
0.14.0 | v0.14.0 | 2.10.0 | 0.9.0 |
0.13.0 | v0.13.0 | 2.9.0 | 0.8.0 |
0.12.0 | v0.12.0 | 2.8.0 | 0.7.0 |
0.11.0 | v0.11.0 | 2.7.0 | 0.6.0 |
0.10.0 | v0.10.0 | 2.6.0 | |
0.9.0 | v0.9.0 | 2.6.0 | |
0.8.0 | v0.8.0 | 2.5.0 | |
0.7.1 | v0.7.1 | 2.4.0 | |
0.6.0 | v0.6.0 | 2.3.0 | |
0.5.0 | v0.5.0 | 2.2.0 | |
0.4.0 | v0.4.0 | 2.1.0 | |
0.3.0 | v0.3.0 | 1.15.0 ve 2.0.0. |
Prensipler
Bu proje, Google'ın yapay zeka ilkelerine uygundur. Bu projeye katılarak, kullanarak veya katkıda bulunarak bu ilkelere uymanız beklenmektedir.
Alıntı
Bu kodu kullanırsanız, lütfen şu şekilde alıntı yapın:
@misc{TFAgents,
title = { {TF-Agents}: A library for Reinforcement Learning in TensorFlow},
author = {Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and
Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and
Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and
Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and
Vincent Vanhoucke and Eugene Brevdo},
howpublished = {\url{https://github.com/tensorflow/agents} },
url = "https://github.com/tensorflow/agents",
year = 2018,
note = "[Online; accessed 25-June-2019]"
}