التعلم المعزز باستخدام TensorFlow
يسهل الوكلاء تصميم وتنفيذ واختبار خوارزميات RL الجديدة ، من خلال توفير مكونات معيارية تم اختبارها جيدًا ويمكن تعديلها وتوسيعها. إنه يتيح التكرار السريع للشفرة ، مع تكامل اختبار جيد وقياس معياري.
للبدء ، نوصي بالاطلاع على أحد برامجنا التعليمية .
التركيب
تنشر TF-Agents تصميمات ليلية ومستقرة. للحصول على قائمة الإصدارات ، اقرأ قسم الإصدارات . تغطي الأوامر أدناه تثبيت TF-Agents بشكل مستقر وليلي من pypi.org وكذلك من استنساخ GitHub.
مستقر
قم بتشغيل الأوامر أدناه لتثبيت أحدث إصدار ثابت. وثائق API للإصدار موجودة على tensorflow.org .
$ pip install --user tf-agents[reverb]
# Use this tag get the matching examples and colabs.
$ git clone https://github.com/tensorflow/agents.git
$ cd agents
$ git checkout v0.15.0
إذا كنت ترغب في تثبيت TF-Agents بإصدارات من Tensorflow أو Reverb التي تم وضع علامة عليها على أنها غير متوافقة من خلال فحص تبعية النقطة ، فاستخدم النمط التالي أدناه على مسؤوليتك الخاصة.
$ pip install --user tensorflow
$ pip install --user dm-reverb
$ pip install --user tf-agents
إذا كنت تريد استخدام TF-Agents مع TensorFlow 1.15 أو 2.0 ، فقم بتثبيت الإصدار 0.3.0:
# Newer versions of tensorflow-probability require newer versions of TensorFlow.
$ pip install tensorflow-probability==0.8.0
$ pip install tf-agents==0.3.0
ليلا
تتضمن الإصدارات الليلية ميزات أحدث ، ولكنها قد تكون أقل استقرارًا من الإصدارات التي تم إصدارها. يتم دفع البناء الليلي tf-agents-nightly
. نقترح تثبيت إصدارات ليلية من TensorFlow ( tf-nightly
) و TensorFlow Probability ( tfp-nightly
) حيث أن هذه هي الإصدارات التي يتم اختبارها على وكلاء TF ليلاً.
لتثبيت إصدار الإصدار الليلي ، قم بتشغيل ما يلي:
# `--force-reinstall helps guarantee the right versions.
$ pip install --user --force-reinstall tf-nightly
$ pip install --user --force-reinstall tfp-nightly
$ pip install --user --force-reinstall dm-reverb-nightly
# Installing with the `--upgrade` flag ensures you'll get the latest version.
$ pip install --user --upgrade tf-agents-nightly
من جيثب
بعد استنساخ المستودع ، يمكن تثبيت التبعيات عن طريق تشغيل pip install -e .[tests]
. يجب تثبيت pip install --user tf-nightly
.
المساهمة
نحن حريصون على التعاون معك! راجع CONTRIBUTING.md
للحصول على دليل حول كيفية المساهمة. يلتزم هذا المشروع بقواعد السلوك الخاصة بـ TensorFlow. من خلال المشاركة ، من المتوقع أن تتمسك بهذا الرمز.
إطلاق
وكلاء TF لديها إصدارات مستقرة وليلية. غالبًا ما تكون الإصدارات الليلية جيدة ولكن يمكن أن يكون لها مشكلات بسبب أن المكتبات الأولية في حالة تغير مستمر. يسرد الجدول أدناه إصدار (إصدارات) TensorFlow التي تم اختبارها مع كل إصدار من إصدارات TF Agents لمساعدة المستخدمين الذين قد يتم تقييدهم في إصدار معين من TensorFlow. 0.9.0 كان الإصدار الأخير المتوافق مع Python 3.6. 0.3.0 كان الإصدار الأخير المتوافق مع Python 2.
يطلق | الفرع / العلامة | نسخة TensorFlow | نسخة تردد dm |
---|---|---|---|
ليلا | رئيسي - سيد | tf- كل ليلة | dm- تردد-ليلا |
0.15.0 | الإصدار 0.15.0 | 2.11.0 | 0.10.0 |
0.14.0 | الإصدار 0.14.0 | 2.10.0 | 0.9.0 |
0.13.0 | الإصدار 0.13.0 | 2.9.0 | 0.8.0 |
0.12.0 | الإصدار 0.12.0 | 2.8.0 | 0.7.0 |
0.11.0 | الإصدار 0.11.0 | 2.7.0 | 0.6.0 |
0.10.0 | الإصدار 0.10.0 | 2.6.0 | |
0.9.0 | الإصدار 0.9.0 | 2.6.0 | |
0.8.0 | الإصدار 0.8.0 | 2.5.0 | |
0.7.1 | الإصدار 0.7.1 | 2.4.0 | |
0.6.0 | الإصدار 0.6.0 | 2.3.0 | |
0.5.0 | الإصدار 0.5.0 | 2.2.0 | |
0.4.0 | الإصدار 0.4.0 | 2.1.0 | |
0.3.0 | الإصدار 0.3.0 | 1.15.0 و 2.0.0. |
مبادئ
يلتزم هذا المشروع بمبادئ الذكاء الاصطناعي الخاصة بـ Google . من خلال المشاركة في هذا المشروع أو استخدامه أو المساهمة فيه ، من المتوقع أن تلتزم بهذه المبادئ.
الاقتباس
إذا كنت تستخدم هذا الرمز ، فيرجى ذكره على النحو التالي:
@misc{TFAgents,
title = { {TF-Agents}: A library for Reinforcement Learning in TensorFlow},
author = {Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and
Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and
Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and
Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and
Vincent Vanhoucke and Eugene Brevdo},
howpublished = {\url{https://github.com/tensorflow/agents} },
url = "https://github.com/tensorflow/agents",
year = 2018,
note = "[Online; accessed 25-June-2019]"
}