סוכני TensorFlow

למידת חיזוק עם TensorFlow

Agents מקל על תכנון, הטמעה ובדיקת אלגוריתמי RL חדשים, על ידי אספקת רכיבים מודולריים שנבדקו היטב הניתנים לשינוי ולהרחבה. זה מאפשר איטרציה מהירה של קוד, עם אינטגרציה טובה של בדיקות ומידוד.

כדי להתחיל, אנו ממליצים לבדוק את אחד מהמדריכים שלנו.

הַתקָנָה

TF-Agents מפרסם פריטים ליליים ויציבים. לרשימה של מהדורות קרא את הסעיף מהדורות . הפקודות למטה מכסות התקנת TF-Agents יציבה ולילה מ- pypi.org כמו גם משבט GitHub.

יַצִיב

הפעל את הפקודות למטה כדי להתקין את המהדורה היציבה האחרונה. תיעוד API עבור המהדורה נמצא באתר tensorflow.org .

$ pip install --user tf-agents[reverb]

# Use this tag get the matching examples and colabs.
$ git clone https://github.com/tensorflow/agents.git
$ cd agents
$ git checkout v0.13.0

אם אתה רוצה להתקין TF-Agents עם גרסאות של Tensorflow או Reverb המסומנות כלא תואמות על ידי בדיקת התלות ב-pip, השתמש בדפוס הבא למטה על אחריותך בלבד.

$ pip install --user tensorflow
$ pip install --user dm-reverb
$ pip install --user tf-agents

אם ברצונך להשתמש ב-TF-Agents עם TensorFlow 1.15 או 2.0, התקן את גרסה 0.3.0:

# Newer versions of tensorflow-probability require newer versions of TensorFlow.
$ pip install tensorflow-probability==0.8.0
$ pip install tf-agents==0.3.0

לֵילִי

בנייה לילית כוללת תכונות חדשות יותר, אך עשויות להיות פחות יציבות מהגרסאות המהדורות. המבנה הלילי נדחף כ- tf-agents-nightly . אנו מציעים להתקין גרסאות ליליות של TensorFlow ( tf-nightly nightly) ושל TensorFlow Probability ( tfp-nightly ) מכיוון שאלו הן הגרסאות ש-TF-Agents מדי לילה נבדקות מולן.

כדי להתקין את גרסת הבנייה הלילית, הפעל את הפעולות הבאות:

# `--force-reinstall helps guarantee the right versions.
$ pip install --user --force-reinstall tf-nightly
$ pip install --user --force-reinstall tfp-nightly
$ pip install --user --force-reinstall dm-reverb-nightly

# Installing with the `--upgrade` flag ensures you'll get the latest version.
$ pip install --user --upgrade tf-agents-nightly

מ-GitHub

לאחר שיבוט המאגר, ניתן להתקין את התלות על ידי הפעלת pip install -e .[tests] . יש להתקין את TensorFlow באופן עצמאי: pip install --user tf-nightly .

תורם

אנחנו להוטים לשתף איתך פעולה! ראה CONTRIBUTING.md למדריך כיצד לתרום. פרויקט זה מציית לקוד ההתנהגות של TensorFlow. על ידי השתתפות, אתה צפוי לשמור על קוד זה.

משחרר

ל-TF Agents יש מהדורות יציבות ולילות. המהדורות הליליות הן לרוב בסדר, אך יכולות להיות בעיות עקב זרימת ספריות במעלה הזרם. הטבלה שלהלן מפרטת את הגירסאות של TensorFlow שנבדקו עם כל מהדורה של כל TF Agents כדי לעזור למשתמשים שעשויים להיות נעולים בגרסה ספציפית של TensorFlow.

לְשַׁחְרֵר סניף / תג גרסת TensorFlow
לֵילִי לִשְׁלוֹט tf-לילי
0.13.0 v0.13.0 2.9.0
0.12.0 v0.12.0 2.8.0
0.11.0 v0.11.0 2.7.0
0.10.0 v0.10.0 2.6.0
0.9.0 v0.9.0 2.6.0
0.8.0 v0.8.0 2.5.0
0.7.1 v0.7.1 2.4.0
0.6.0 v0.6.0 2.3.0
0.5.0 v0.5.0 2.2.0
0.4.0 v0.4.0 2.1.0
0.3.0 v0.3.0 1.15.0 ו-2.0.0

עקרונות

פרויקט זה תומך בעקרונות הבינה המלאכותית של גוגל . על ידי השתתפות, שימוש או תרומה לפרויקט זה מצופה ממך לדבוק בעקרונות אלו.

צִיטָטָה

אם אתה משתמש בקוד זה, נא לצטט אותו כ:

@misc{TFAgents,
  title = { {TF-Agents}: A library for Reinforcement Learning in TensorFlow},
  author = {Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and
     Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and
     Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and
     Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and
     Vincent Vanhoucke and Eugene Brevdo},
  howpublished = {\url{https://github.com/tensorflow/agents} },
  url = "https://github.com/tensorflow/agents",
  year = 2018,
  note = "[Online; accessed 25-June-2019]"
}