Đại lý TensorFlow

Học tập củng cố với TensorFlow

Các đại lý giúp việc thiết kế, triển khai và thử nghiệm các thuật toán RL mới dễ dàng hơn, bằng cách cung cấp các thành phần mô-đun đã được thử nghiệm tốt có thể được sửa đổi và mở rộng. Nó cho phép lặp lại mã nhanh chóng, với tích hợp thử nghiệm tốt và đo điểm chuẩn.

Để bắt đầu, chúng tôi khuyên bạn nên kiểm tra ra một trong chúng tôi hướng dẫn .

Cài đặt

TF-Agents xuất bản các bản dựng hàng đêm và ổn định. Đối với một danh sách các phiên bản đọc phiên bản phần. Các lệnh bên dưới nắp cài đặt TF-Đại lý ổn định và hàng đêm từ pypi.org cũng như từ một bản sao GitHub.

Ổn định

Chạy các lệnh bên dưới để cài đặt bản phát hành ổn định gần đây nhất. Tài liệu API cho việc phát hành là trên tensorflow.org .

$ pip install --user tf-agents[reverb]

# Use this tag get the matching examples and colabs.
$ git clone https://github.com/tensorflow/agents.git
$ cd agents
$ git checkout v0.8.0

Nếu bạn muốn cài đặt TF-Đại lý với các phiên bản của Tensorflow hoặc Reverb được gắn cờ là không tương thích bằng cách kiểm tra sự phụ thuộc pip, sử dụng mô hình sau đây có nguy cơ của riêng bạn.

$ pip install --user tensorflow
$ pip install --user dm-reverb
$ pip install --user tf-agents

Nếu bạn muốn sử dụng TF-Agents với TensorFlow 1.15 hoặc 2.0, hãy cài đặt phiên bản 0.3.0:

# Newer versions of tensorflow-probability require newer versions of TensorFlow.
$ pip install tensorflow-probability==0.8.0
$ pip install tf-agents==0.3.0

Hàng đêm

Các bản dựng hàng đêm bao gồm các tính năng mới hơn, nhưng có thể kém ổn định hơn so với các bản phát hành có phiên bản. Các đêm xây dựng được đẩy như tf-agents-nightly . Chúng tôi đề nghị cài đặt các phiên bản hàng đêm của TensorFlow ( tf-nightly ) và TensorFlow Xác suất ( tfp-nightly ) như đó là những phiên bản TF-Đại lý hàng đêm được kiểm tra chống lại.

Để cài đặt phiên bản xây dựng hàng đêm, hãy chạy như sau:

# `--force-reinstall helps guarantee the right versions.
$ pip install --user --force-reinstall tf-nightly
$ pip install --user --force-reinstall tfp-nightly
$ pip install --user --force-reinstall dm-reverb-nightly

# Installing with the `--upgrade` flag ensures you'll get the latest version.
$ pip install --user --upgrade tf-agents-nightly

Của GitHub

Sau khi nhân bản kho, sự phụ thuộc có thể được cài đặt bằng cách chạy pip install -e .[tests] . TensorFlow cần phải được cài đặt một cách độc lập: pip install --user tf-nightly .

Đóng góp

Chúng tôi rất mong được cộng tác với bạn! Xem CONTRIBUTING.md cho một hướng dẫn về làm thế nào để đóng góp. Dự án này tuân thủ TensorFlow của quy tắc ứng xử . Bằng cách tham gia, bạn phải duy trì mã này.

Bản phát hành

TF Agents có các bản phát hành ổn định và hàng đêm. Các bản phát hành hàng đêm thường ổn nhưng có thể có vấn đề do các thư viện ngược dòng đang hoạt động. Bảng dưới đây liệt kê (các) phiên bản của TensorFlow được thử nghiệm với mỗi bản phát hành của Đại lý TF để giúp những người dùng có thể bị khóa trong một phiên bản cụ thể của TensorFlow.

Giải phóng Chi nhánh / Thẻ Phiên bản TensorFlow
Hàng đêm bậc thầy tf-hàng đêm
0,8,0 v0.8.0 2.5.0
0,7,1 v0.7.1 2.4.0
0,6.0 v0.6.0 2.3.0
0,5,0 v0.5.0 2.2.0
0,4.0 v0.4.0 2.1.0
0,3.0 v0.3.0 1.15.0 và 2.0.0

Nguyên tắc

Dự án này tuân thủ các nguyên tắc AI của Google . Bằng cách tham gia, sử dụng hoặc đóng góp vào dự án này, bạn phải tuân thủ các nguyên tắc này.

Trích dẫn

Nếu bạn sử dụng mã này, vui lòng trích dẫn nó là:

@misc{TFAgents,
  title = { {TF-Agents}: A library for Reinforcement Learning in TensorFlow},
  author = {Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and
     Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and
     Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and
     Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and
     Vincent Vanhoucke and Eugene Brevdo},
  howpublished = {\url{https://github.com/tensorflow/agents} },
  url = "https://github.com/tensorflow/agents",
  year = 2018,
  note = "[Online; accessed 25-June-2019]"
}