Học tập củng cố với TensorFlow
Các đại lý giúp thiết kế, triển khai và thử nghiệm các thuật toán RL mới dễ dàng hơn, bằng cách cung cấp các thành phần mô-đun đã được kiểm tra tốt có thể được sửa đổi và mở rộng. Nó cho phép lặp lại mã nhanh chóng, tích hợp thử nghiệm tốt và đo điểm chuẩn.
Để bắt đầu, chúng tôi khuyên bạn nên xem một trong các hướng dẫn của chúng tôi.
Cài đặt
TF-Agents xuất bản các bản dựng hàng đêm và ổn định. Để biết danh sách các bản phát hành, hãy đọc phần Bản phát hành . Các lệnh dưới đây bao gồm việc cài đặt TF-Agents ổn định và hàng đêm từ pypi.org cũng như từ bản sao GitHub.
Ổn định
Chạy các lệnh bên dưới để cài đặt bản phát hành ổn định gần đây nhất. Tài liệu API cho bản phát hành có trên tensorflow.org .
$ pip install --user tf-agents[reverb]
# Use this tag get the matching examples and colabs.
$ git clone https://github.com/tensorflow/agents.git
$ cd agents
$ git checkout v0.7.1
Nếu bạn muốn cài đặt TF-Agents với các phiên bản của Tensorflow hoặc Reverb được đánh dấu là không tương thích bởi kiểm tra phụ thuộc pip, hãy tự chịu rủi ro khi sử dụng mẫu sau đây.
$ pip install --user tensorflow
$ pip install --user dm-reverb
$ pip install --user tf-agents
Nếu bạn muốn sử dụng TF-Agents với TensorFlow 1.15 hoặc 2.0, hãy cài đặt phiên bản 0.3.0:
# Newer versions of tensorflow-probability require newer versions of TensorFlow.
$ pip install tensorflow-probability==0.8.0
$ pip install tf-agents==0.3.0
Hàng đêm
Các bản dựng hàng đêm bao gồm các tính năng mới hơn, nhưng có thể kém ổn định hơn so với các bản phát hành có phiên bản. Việc xây dựng hàng đêm được đẩy như tf-agents-nightly
. Chúng tôi khuyên bạn nên cài đặt phiên bản hàng đêm của TensorFlow ( tf-nightly
) và TensorFlow Probability ( tfp-nightly
) vì đó là những phiên bản TF-Agents hàng đêm được thử nghiệm.
Để cài đặt phiên bản xây dựng hàng đêm, hãy chạy như sau:
# `--force-reinstall helps guarantee the right versions.
$ pip install --user --force-reinstall tf-nightly
$ pip install --user --force-reinstall tfp-nightly
$ pip install --user --force-reinstall dm-reverb-nightly
# Installing with the `--upgrade` flag ensures you'll get the latest version.
$ pip install --user --upgrade tf-agents-nightly
Của GitHub
Sau khi nhân bản kho lưu trữ, các phần phụ thuộc có thể được cài đặt bằng cách chạy pip install -e .[tests]
. TensorFlow cần được cài đặt độc lập: pip install --user tf-nightly
.
Đóng góp
Chúng tôi rất mong được cộng tác với bạn! Xem CONTRIBUTING.md
để biết hướng dẫn về cách đóng góp. Dự án này tuân thủ quy tắc ứng xử của TensorFlow. Bằng cách tham gia, bạn được mong đợi duy trì mã này.
Phát hành
TF Agents có bản phát hành ổn định và hàng đêm. Các bản phát hành hàng đêm thường ổn nhưng có thể có vấn đề do các thư viện ngược dòng đang hoạt động. Bảng dưới đây liệt kê (các) phiên bản của TensorFlow được thử nghiệm với mỗi bản phát hành của TF Agents để giúp những người dùng có thể bị khóa trong một phiên bản cụ thể của TensorFlow.
Giải phóng | Chi nhánh / Thẻ | Phiên bản TensorFlow |
---|---|---|
Hàng đêm | bậc thầy | tf-hàng đêm |
0,7,1 | v0.7.1 | 2.4.0 |
0,6.0 | v0.6.0 | 2.3.0 |
0,5,0 | v0.5.0 | 2.2.0 |
0,4.0 | v0.4.0 | 2.1.0 |
0,3.0 | v0.3.0 | 1.15.0 và 2.0.0 |
Nguyên tắc
Dự án này tuân thủ các nguyên tắc AI của Google . Bằng cách tham gia, sử dụng hoặc đóng góp vào dự án này, bạn phải tuân thủ các nguyên tắc này.
Trích dẫn
Nếu bạn sử dụng mã này, vui lòng trích dẫn nó là:
@misc{TFAgents,
title = { {TF-Agents}: A library for Reinforcement Learning in TensorFlow},
author = {Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and
Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and
Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and
Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and
Vincent Vanhoucke and Eugene Brevdo},
howpublished = {\url{https://github.com/tensorflow/agents} },
url = "https://github.com/tensorflow/agents",
year = 2018,
note = "[Online; accessed 25-June-2019]"
}