TensorFlow ile Takviyeli Öğrenme
Aracılar, değiştirilebilen ve genişletilebilen, iyi test edilmiş modüler bileşenler sağlayarak yeni RL algoritmalarını tasarlamayı, uygulamayı ve test etmeyi kolaylaştırır. İyi test entegrasyonu ve kıyaslama ile hızlı kod yineleme sağlar.
Başlamak için eğiticilerimizden birine göz atmanızı öneririz.
Kurulum
TF-Agents, her gece ve kararlı derlemeler yayınlar. Sürümlerin bir listesi için Sürümler bölümünü okuyun. Aşağıdaki komutlar, TF-Agent'ların kararlı ve her gece pypi.org'dan ve bir GitHub klonundan yüklenmesini kapsar.
Kararlı
En son kararlı sürümü yüklemek için aşağıdaki komutları çalıştırın. Sürüm için API belgeleri tensorflow.org adresindedir .
$ pip install --user tf-agents[reverb]
# Use this tag get the matching examples and colabs.
$ git clone https://github.com/tensorflow/agents.git
$ cd agents
$ git checkout v0.12.0
TF-Agent'ları, Tensorflow veya Reverb'in pip bağımlılık kontrolü tarafından uyumlu değil olarak işaretlenmiş sürümleriyle kurmak istiyorsanız, aşağıdaki kalıbı kullanın.
$ pip install --user tensorflow
$ pip install --user dm-reverb
$ pip install --user tf-agents
TF-Agent'ları TensorFlow 1.15 veya 2.0 ile kullanmak istiyorsanız, 0.3.0 sürümünü yükleyin:
# Newer versions of tensorflow-probability require newer versions of TensorFlow.
$ pip install tensorflow-probability==0.8.0
$ pip install tf-agents==0.3.0
her gece
Gecelik derlemeler daha yeni özellikler içerir, ancak sürümlü sürümlerden daha az kararlı olabilir. Gecelik yapı, tf-agents-nightly
olarak itilir. TensorFlow'un ( tf-nightly
) ve TensorFlow Probability'nin ( tfp-nightly
) gecelik sürümlerini yüklemenizi öneririz, çünkü bunlar TF-Agent'ların her gece test edildiği sürümlerdir.
Gecelik derleme sürümünü yüklemek için aşağıdakileri çalıştırın:
# `--force-reinstall helps guarantee the right versions.
$ pip install --user --force-reinstall tf-nightly
$ pip install --user --force-reinstall tfp-nightly
$ pip install --user --force-reinstall dm-reverb-nightly
# Installing with the `--upgrade` flag ensures you'll get the latest version.
$ pip install --user --upgrade tf-agents-nightly
GitHub'dan
Depoyu klonladıktan sonra, bağımlılıklar pip install -e .[tests]
çalıştırılarak kurulabilir. TensorFlow'un bağımsız olarak yüklenmesi gerekir: pip install --user tf-nightly
.
Katkı
Sizinle işbirliği yapmak için can atıyoruz! Nasıl katkıda bulunacağınıza ilişkin bir kılavuz için CONTRIBUTING.md
bakın. Bu proje, TensorFlow'un davranış kurallarına bağlıdır. Katılarak, bu kodu desteklemeniz beklenir.
Salıverme
TF Agents'ın kararlı ve her gece yayınlanan sürümleri vardır. Gecelik sürümler genellikle iyidir ancak akış yukarı kitaplıkların akışta olması nedeniyle sorunlar olabilir. Aşağıdaki tablo, belirli bir TensorFlow sürümüne kilitlenebilecek kullanıcılara yardımcı olmak için her TF Aracısı sürümüyle test edilen TensorFlow sürümlerini listeler.
Serbest bırakmak | Şube / Etiket | TensorFlow Sürümü |
---|---|---|
her gece | usta | tf-gecelik |
0.12.0 | v0.12.0 | 2.8.0 |
0.11.0 | v0.11.0 | 2.7.0 |
0.10.0 | v0.10.0 | 2.6.0 |
0.9.0 | v0.9.0 | 2.6.0 |
0.8.0 | v0.8.0 | 2.5.0 |
0.7.1 | v0.7.1 | 2.4.0 |
0.6.0 | v0.6.0 | 2.3.0 |
0.5.0 | v0.5.0 | 2.2.0 |
0.4.0 | v0.4.0 | 2.1.0 |
0.3.0 | v0.3.0 | 1.15.0 ve 2.0.0 |
Prensipler
Bu proje, Google'ın AI ilkelerine bağlıdır. Bu projeye katılarak, kullanarak veya katkıda bulunarak bu ilkelere uymanız beklenmektedir.
Alıntı
Bu kodu kullanırsanız, lütfen şu şekilde alıntı yapın:
@misc{TFAgents,
title = { {TF-Agents}: A library for Reinforcement Learning in TensorFlow},
author = {Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and
Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and
Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and
Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and
Vincent Vanhoucke and Eugene Brevdo},
howpublished = {\url{https://github.com/tensorflow/agents} },
url = "https://github.com/tensorflow/agents",
year = 2018,
note = "[Online; accessed 25-June-2019]"
}