TensorFlow Aracıları

TensorFlow ile Takviyeli Öğrenme

Agents, iyi test edilmiş, değiştirilebilen ve genişletilebilen modüler bileşenler sağlayarak yeni RL algoritmalarının tasarlanmasını, uygulanmasını ve test edilmesini kolaylaştırır. İyi test entegrasyonu ve kıyaslama ile hızlı kod yinelemesine olanak tanır.

Başlamak için eğitimlerimizden birine göz atmanızı öneririz.

Kurulum

TF-Agents her gece ve kararlı sürümler yayınlıyor. Sürümlerin listesi için Sürümler bölümünü okuyun. Aşağıdaki komutlar, TF-Agent'ların istikrarlı ve gecelik olarak pypi.org'dan ve GitHub klonundan kurulmasını kapsar.

:uyarı: Çok yaygın olan Reverb (tekrar oynatma arabelleği) kullanılıyorsa, TF-Agent'lar yalnızca Linux ile çalışacaktır.

Stabil

En güncel kararlı sürümü yüklemek için aşağıdaki komutları çalıştırın. Sürüme ilişkin API belgeleri tensorflow.org adresinde bulunmaktadır.

$ pip install --user tf-agents[reverb]

# Use keras-2
$ export TF_USE_LEGACY_KERAS=1
# Use this tag get the matching examples and colabs.
$ git clone https://github.com/tensorflow/agents.git
$ cd agents
$ git checkout v0.19.0

TF-Agent'ları, pip bağımlılığı kontrolü tarafından uyumlu değil olarak işaretlenen Tensorflow veya Reverb sürümleriyle yüklemek istiyorsanız, risk size ait olmak üzere aşağıdaki modeli kullanın.

$ pip install --user tensorflow
$ pip install --user tf-keras
$ pip install --user dm-reverb
$ pip install --user tf-agents

TF-Agents'ı TensorFlow 1.15 veya 2.0 ile kullanmak istiyorsanız 0.3.0 sürümünü yükleyin:

# Newer versions of tensorflow-probability require newer versions of TensorFlow.
$ pip install tensorflow-probability==0.8.0
$ pip install tf-agents==0.3.0

her gece

Gecelik sürümler daha yeni özellikler içerir ancak sürümlendirilmiş sürümlere göre daha az kararlı olabilir. Nightly yapısı tf-agents-nightly olarak aktarılır. TensorFlow'un ( tf-nightly ) ve TensorFlow Probability'nin ( tfp-nightly ) gecelik sürümlerini yüklemenizi öneririz çünkü bunlar, TF-Agent'ların gecelik olarak test edildiği sürümlerdir.

Gecelik derleme sürümünü yüklemek için aşağıdakileri çalıştırın:

# Use keras-2
$ export TF_USE_LEGACY_KERAS=1
# `--force-reinstall helps guarantee the right versions.
$ pip install --user --force-reinstall tf-nightly
$ pip install --user --force-reinstall tf-keras-nightly
$ pip install --user --force-reinstall tfp-nightly
$ pip install --user --force-reinstall dm-reverb-nightly

# Installing with the `--upgrade` flag ensures you'll get the latest version.
$ pip install --user --upgrade tf-agents-nightly

GitHub'dan

Depoyu klonladıktan sonra bağımlılıklar pip install -e .[tests] çalıştırılarak kurulabilir. TensorFlow'un bağımsız olarak kurulması gerekir: pip install --user tf-nightly .

Katkı

Sizinle işbirliği yapmak için sabırsızlanıyoruz! Nasıl katkıda bulunacağınıza ilişkin bir kılavuz için CONTRIBUTING.md bakın. Bu proje TensorFlow'un davranış kurallarına uygundur. Katılarak bu kurallara uymanız bekleniyor.

Salıverme

TF Agents'ın istikrarlı ve gecelik sürümleri vardır. Gecelik sürümler genellikle iyidir ancak yukarı akış kitaplıklarının akış halinde olması nedeniyle sorunlar yaşayabilir. Aşağıdaki tablo, her TF Agent sürümüyle uyumlu TensorFlow sürümlerini listelemektedir. İlgilenilen sürümler:

  • 0.19.0, tensorflow-2.15.0'ı destekler.
  • 0.18.0, Python 3.8 desteğini düşürdü.
  • 0.16.0, Python 3.11'i destekleyen ilk sürümdür.
  • 0.15.0, Python 3.7 ile uyumlu son sürümdür.
  • Numpy < 1.19 kullanıyorsanız TF-Agents 0.15.0 veya önceki sürümünü kullanın.
  • 0.9.0, Python 3.6 ile uyumlu son sürümdür.
  • 0.3.0, Python 2.x ile uyumlu son sürümdür.
Serbest bırakmak Şube / Etiket TensorFlow Sürümü dm-reverb Sürümü
her gece usta tf-gecelik dm-reverb-gecelik
0.19.0 v0.19.0 2.15.0 0.14.0
0.18.0 v0.18.0 2.14.0 0.13.0
0.17.0 v0.17.0 2.13.0 0.12.0
0.16.0 v0.16.0 2.12.0 0.11.0
0.15.0 v0.15.0 2.11.0 0.10.0
0.14.0 v0.14.0 2.10.0 0.9.0
0.13.0 v0.13.0 2.9.0 0.8.0
0.12.0 v0.12.0 2.8.0 0.7.0
0.11.0 v0.11.0 2.7.0 0.6.0
0.10.0 v0.10.0 2.6.0
0.9.0 v0.9.0 2.6.0
0.8.0 v0.8.0 2.5.0
0.7.1 v0.7.1 2.4.0
0.6.0 v0.6.0 2.3.0
0.5.0 v0.5.0 2.2.0
0.4.0 v0.4.0 2.1.0
0.3.0 v0.3.0 1.15.0 ve 2.0.0.

Prensipler

Bu proje Google'ın yapay zeka ilkelerine uygundur. Bu projeye katılarak, kullanarak veya katkıda bulunarak bu ilkelere bağlı kalmanız beklenmektedir.

Alıntı

Bu kodu kullanıyorsanız lütfen şu şekilde belirtin:

@misc{TFAgents,
  title = { {TF-Agents}: A library for Reinforcement Learning in TensorFlow},
  author = {Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and
     Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and
     Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and
     Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and
     Vincent Vanhoucke and Eugene Brevdo},
  howpublished = {\url{https://github.com/tensorflow/agents} },
  url = "https://github.com/tensorflow/agents",
  year = 2018,
  note = "[Online; accessed 25-June-2019]"
}