Đại lý TensorFlow

Học củng cố với TensorFlow

Các đại lý giúp thiết kế, triển khai và thử nghiệm các thuật toán RL mới dễ dàng hơn, bằng cách cung cấp các thành phần mô-đun đã được kiểm tra tốt có thể được sửa đổi và mở rộng. Nó cho phép lặp lại mã nhanh chóng, với tích hợp thử nghiệm tốt và đo điểm chuẩn.

Để bắt đầu, chúng tôi khuyên bạn nên xem một trong các hướng dẫn của chúng tôi.

Cài đặt

TF-Agents xuất bản các bản dựng hàng đêm và ổn định. Để biết danh sách các bản phát hành, hãy đọc phần Bản phát hành . Các lệnh dưới đây bao gồm việc cài đặt TF-Agents ổn định và hàng đêm từ pypi.org cũng như từ bản sao GitHub.

Ổn định

Chạy các lệnh bên dưới để cài đặt bản phát hành ổn định gần đây nhất. Tài liệu API cho bản phát hành có trên tensorflow.org .

$ pip install --user tf-agents[reverb]

# Use this tag get the matching examples and colabs.
$ git clone https://github.com/tensorflow/agents.git
$ cd agents
$ git checkout v0.13.0

Nếu bạn muốn cài đặt TF-Agents với các phiên bản của Tensorflow hoặc Reverb được đánh dấu là không tương thích bởi kiểm tra phụ thuộc pip, hãy tự chịu rủi ro khi sử dụng mẫu sau đây.

$ pip install --user tensorflow
$ pip install --user dm-reverb
$ pip install --user tf-agents

Nếu bạn muốn sử dụng TF-Agents với TensorFlow 1.15 hoặc 2.0, hãy cài đặt phiên bản 0.3.0:

# Newer versions of tensorflow-probability require newer versions of TensorFlow.
$ pip install tensorflow-probability==0.8.0
$ pip install tf-agents==0.3.0

Hàng đêm

Các bản dựng hàng đêm bao gồm các tính năng mới hơn, nhưng có thể kém ổn định hơn so với các bản phát hành có phiên bản. Việc xây dựng hàng đêm được đẩy như tf-agents-nightly . Chúng tôi khuyên bạn nên cài đặt các phiên bản hàng đêm của TensorFlow ( tf-nightly ) và TensorFlow Probability ( tfp-nightly ) vì đó là những phiên bản TF-Agents được thử nghiệm hàng đêm.

Để cài đặt phiên bản xây dựng hàng đêm, hãy chạy như sau:

# `--force-reinstall helps guarantee the right versions.
$ pip install --user --force-reinstall tf-nightly
$ pip install --user --force-reinstall tfp-nightly
$ pip install --user --force-reinstall dm-reverb-nightly

# Installing with the `--upgrade` flag ensures you'll get the latest version.
$ pip install --user --upgrade tf-agents-nightly

Của GitHub

Sau khi nhân bản kho lưu trữ, các phần phụ thuộc có thể được cài đặt bằng cách chạy pip install -e .[tests] . TensorFlow cần được cài đặt độc lập: pip install --user tf-nightly .

Đóng góp

Chúng tôi rất mong được cộng tác với bạn! Xem CONTRIBUTING.md để biết hướng dẫn về cách đóng góp. Dự án này tuân thủ quy tắc ứng xử của TensorFlow. Bằng cách tham gia, bạn sẽ duy trì mã này.

Bản phát hành

TF Agents có bản phát hành ổn định và hàng đêm. Các bản phát hành hàng đêm thường ổn nhưng có thể có vấn đề do các thư viện ngược dòng đang hoạt động. Bảng dưới đây liệt kê (các) phiên bản của TensorFlow được thử nghiệm với mỗi bản phát hành của TF Agents để giúp những người dùng có thể bị khóa trong một phiên bản cụ thể của TensorFlow.

Phóng thích Chi nhánh / Thẻ Phiên bản TensorFlow
Hàng đêm bậc thầy tf-hàng đêm
0,13,0 v0.13.0 2.9.0
0,12,0 v0.12.0 2,8,0
0,11,0 v0.11.0 2.7.0
0,10,0 v0.10.0 2.6.0
0,9.0 v0.9.0 2.6.0
0,8,0 v0.8.0 2.5.0
0,7,1 v0.7.1 2.4.0
0,6.0 v0.6.0 2.3.0
0,5,0 v0.5.0 2.2.0
0,4.0 v0.4.0 2.1.0
0,3.0 v0.3.0 1.15.0 và 2.0.0

Nguyên tắc

Dự án này tuân thủ các nguyên tắc AI của Google . Bằng cách tham gia, sử dụng hoặc đóng góp cho dự án này, bạn phải tuân thủ các nguyên tắc này.

Trích dẫn

Nếu bạn sử dụng mã này, vui lòng trích dẫn nó là:

@misc{TFAgents,
 title = { {TF-Agents}: A library for Reinforcement Learning in TensorFlow},
 author = {Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and
   Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and
   Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and
   Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and
   Vincent Vanhoucke and Eugene Brevdo},
 howpublished = {\url{https://github.com/tensorflow/agents} },
 url = "https://github.com/tensorflow/agents",
 year = 2018,
 note = "[Online; accessed 25-June-2019]"
}