סוכני TensorFlow

למידת חיזוק עם TensorFlow

Agents מקל על תכנון, הטמעה ובדיקת אלגוריתמי RL חדשים, על ידי אספקת רכיבים מודולריים שנבדקו היטב הניתנים לשינוי ולהרחבה. הוא מאפשר איטרציה מהירה של קוד, עם אינטגרציה טובה של בדיקות ומידוד.

כדי להתחיל, אנו ממליצים לבדוק את אחד מהמדריכים שלנו.

הַתקָנָה

TF-Agents מפרסם פריטים ליליים ויציבים. לרשימה של מהדורות קרא את הסעיף מהדורות . הפקודות למטה מכסות התקנת TF-Agents יציבה ולילה מ- pypi.org כמו גם משבט GitHub.

:אזהרה: אם משתמשים ב-Reverb (חיץ חוזר), שהוא נפוץ מאוד, TF-Agents יפעלו רק עם לינוקס.

יַצִיב

הפעל את הפקודות למטה כדי להתקין את המהדורה היציבה האחרונה. תיעוד API עבור המהדורה נמצא באתר tensorflow.org .

$ pip install --user tf-agents[reverb]

# Use keras-2
$ export TF_USE_LEGACY_KERAS=1
# Use this tag get the matching examples and colabs.
$ git clone https://github.com/tensorflow/agents.git
$ cd agents
$ git checkout v0.19.0

אם אתה רוצה להתקין TF-Agents עם גרסאות של Tensorflow או Reverb המסומנות כלא תואמות על ידי בדיקת התלות ב-pip, השתמש בדפוס הבא למטה על אחריותך בלבד.

$ pip install --user tensorflow
$ pip install --user tf-keras
$ pip install --user dm-reverb
$ pip install --user tf-agents

אם ברצונך להשתמש ב-TF-Agents עם TensorFlow 1.15 או 2.0, התקן את גרסה 0.3.0:

# Newer versions of tensorflow-probability require newer versions of TensorFlow.
$ pip install tensorflow-probability==0.8.0
$ pip install tf-agents==0.3.0

לֵילִי

בנייה לילית כוללת תכונות חדשות יותר, אך עשויות להיות פחות יציבות מהגרסאות המהדורות. המבנה הלילי נדחף כ- tf-agents-nightly . אנו מציעים להתקין גרסאות ליליות של TensorFlow ( tf-nightly ) ושל TensorFlow Probability ( tfp-nightly ) מכיוון שאלו הן הגרסאות ש-TF-Agents מדי לילה נבדקות נגדן.

כדי להתקין את גרסת הבנייה הלילית, הפעל את הפעולות הבאות:

# Use keras-2
$ export TF_USE_LEGACY_KERAS=1
# `--force-reinstall helps guarantee the right versions.
$ pip install --user --force-reinstall tf-nightly
$ pip install --user --force-reinstall tf-keras-nightly
$ pip install --user --force-reinstall tfp-nightly
$ pip install --user --force-reinstall dm-reverb-nightly

# Installing with the `--upgrade` flag ensures you'll get the latest version.
$ pip install --user --upgrade tf-agents-nightly

מ-GitHub

לאחר שיבוט המאגר, ניתן להתקין את התלות על ידי הפעלת pip install -e .[tests] . יש להתקין את TensorFlow באופן עצמאי: pip install --user tf-nightly .

תורם

אנחנו להוטים לשתף איתך פעולה! ראה CONTRIBUTING.md למדריך כיצד לתרום. פרויקט זה עומד בקוד ההתנהגות של TensorFlow. על ידי השתתפות, אתה צפוי לקיים קוד זה.

משחרר

ל-TF Agents יש מהדורות יציבות ולילות. המהדורות הליליות לרוב בסדר, אך יכולות להיות בעיות עקב יציבות של ספריות במעלה הזרם. הטבלה שלהלן מפרטת את הגירסאות של TensorFlow שמתאימות לגרסה של כל TF Agents. גרסאות שחרור של עניין:

  • 0.19.0 תומך ב-tensorflow-2.15.0.
  • 0.18.0 ירד מהתמיכה של Python 3.8.
  • 0.16.0 היא הגרסה הראשונה שתומכת ב-Python 3.11.
  • 0.15.0 הוא המהדורה האחרונה התואמת ל-Python 3.7.
  • אם אתה משתמש ב-numpy < 1.19, אז השתמש ב-TF-Agents 0.15.0 או קודם לכן.
  • 0.9.0 הוא המהדורה האחרונה התואמת ל-Python 3.6.
  • 0.3.0 הוא המהדורה האחרונה התואמת ל-Python 2.x.
לְשַׁחְרֵר סניף / תג גרסת TensorFlow גרסת dm-reverb
לֵילִי לִשְׁלוֹט tf-לילי dm-reverb-לילי
0.19.0 v0.19.0 2.15.0 0.14.0
0.18.0 v0.18.0 2.14.0 0.13.0
0.17.0 v0.17.0 2.13.0 0.12.0
0.16.0 v0.16.0 2.12.0 0.11.0
0.15.0 v0.15.0 2.11.0 0.10.0
0.14.0 v0.14.0 2.10.0 0.9.0
0.13.0 v0.13.0 2.9.0 0.8.0
0.12.0 v0.12.0 2.8.0 0.7.0
0.11.0 v0.11.0 2.7.0 0.6.0
0.10.0 v0.10.0 2.6.0
0.9.0 v0.9.0 2.6.0
0.8.0 v0.8.0 2.5.0
0.7.1 v0.7.1 2.4.0
0.6.0 v0.6.0 2.3.0
0.5.0 v0.5.0 2.2.0
0.4.0 v0.4.0 2.1.0
0.3.0 v0.3.0 1.15.0 ו-2.0.0.

עקרונות

פרויקט זה תומך בעקרונות הבינה המלאכותית של גוגל . על ידי השתתפות, שימוש או תרומה לפרויקט זה מצופה ממך לדבוק בעקרונות אלו.

צִיטָטָה

אם אתה משתמש בקוד זה, אנא ציין אותו כ:

@misc{TFAgents,
  title = { {TF-Agents}: A library for Reinforcement Learning in TensorFlow},
  author = {Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and
     Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and
     Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and
     Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and
     Vincent Vanhoucke and Eugene Brevdo},
  howpublished = {\url{https://github.com/tensorflow/agents} },
  url = "https://github.com/tensorflow/agents",
  year = 2018,
  note = "[Online; accessed 25-June-2019]"
}