날짜를 저장하십시오! Google I / O가 5 월 18 일부터 20 일까지 반환됩니다. 지금 등록
이 페이지는 Cloud Translation API를 통해 번역되었습니다.
Switch to English

TensorFlow 에이전트

TensorFlow를 사용한 강화 학습

에이전트는 수정 및 확장이 가능한 잘 테스트 된 모듈 식 구성 요소를 제공하여 새로운 RL 알고리즘을보다 쉽게 ​​설계, 구현 및 테스트 할 수 있도록합니다. 우수한 테스트 통합 및 벤치마킹으로 빠른 코드 반복이 가능합니다.

시작하려면 자습서 중 하나를 확인하는 것이 좋습니다.

설치

TF-Agents는 야간에 안정적인 빌드를 게시합니다. 자료의 목록은 읽기 자료의 절을 참조하십시오. 아래 명령은 pypi.org 및 GitHub 클론에서 TF-Agent를 안정적으로 야간에 설치하는 방법을 다룹니다.

안정된

가장 최근의 안정적인 릴리스를 설치하려면 아래 명령을 실행하십시오. 릴리스에 대한 API 문서는 tensorflow.org에 있습니다.

$ pip install --user tf-agents[reverb]

# Use this tag get the matching examples and colabs.
$ git clone https://github.com/tensorflow/agents.git
$ cd agents
$ git checkout v0.7.1

pip 종속성 검사에서 호환되지 않는 것으로 플래그가 지정된 Tensorflow 또는 Reverb 버전으로 TF-Agent를 설치하려는 경우 위험을 감수하고 아래의 다음 패턴을 사용하세요.

$ pip install --user tensorflow
$ pip install --user dm-reverb
$ pip install --user tf-agents

TensorFlow 1.15 또는 2.0에서 TF-Agent를 사용하려면 버전 0.3.0을 설치합니다.

# Newer versions of tensorflow-probability require newer versions of TensorFlow.
$ pip install tensorflow-probability==0.8.0
$ pip install tf-agents==0.3.0

야간

Nightly 빌드에는 새로운 기능이 포함되어 있지만 버전이있는 릴리스보다 안정성이 떨어질 수 있습니다. 야간 빌드는 tf-agents-nightly 로 푸시됩니다. TensorFlow ( tf-nightly ) 및 TensorFlow Probability ( tfp-nightly )의 tfp-nightly 버전은 TF-Agent가 야간에 테스트되는 버전 tfp-nightly 설치하는 것이 좋습니다.

야간 빌드 버전을 설치하려면 다음을 실행하십시오.

# `--force-reinstall helps guarantee the right versions.
$ pip install --user --force-reinstall tf-nightly
$ pip install --user --force-reinstall tfp-nightly
$ pip install --user --force-reinstall dm-reverb-nightly

# Installing with the `--upgrade` flag ensures you'll get the latest version.
$ pip install --user --upgrade tf-agents-nightly

GitHub에서

저장소를 복제 한 후 pip install -e .[tests] 를 실행하여 종속성을 설치할 수 있습니다. TensorFlow는 독립적으로 설치해야합니다 : pip install --user tf-nightly .

기여

우리는 당신과 협력하고 싶습니다! 기여하는 방법에 대한 가이드는 CONTRIBUTING.md 를 참조하십시오. 이 프로젝트는 TensorFlow의 행동 강령을 준수합니다. 참여함으로써 귀하는이 코드를 유지해야합니다.

릴리스

TF 에이전트는 안정적인 야간 릴리스를 제공합니다. 야간 릴리스는 종종 괜찮지 만 업스트림 라이브러리가 유동적이기 때문에 문제가 발생할 수 있습니다. 아래 표에는 특정 버전의 TensorFlow에 잠길 수있는 사용자를 돕기 위해 각 TF 에이전트의 릴리스에서 테스트 된 TensorFlow 버전이 나열되어 있습니다.

해제 분기 / 태그 TensorFlow 버전
야간 석사 tf-nightly
0.7.1 v0.7.1 2.4.0
0.6.0 v0.6.0 2.3.0
0.5.0 v0.5.0 2.2.0
0.4.0 v0.4.0 2.1.0
0.3.0 v0.3.0 1.15.0 및 2.0.0

원칙

이 프로젝트는 Google의 AI 원칙을 준수합니다. 이 프로젝트에 참여, 사용 또는 기여함으로써 귀하는 이러한 원칙을 준수해야합니다.

소환

이 코드를 사용하는 경우 다음과 같이 인용하십시오.

@misc{TFAgents,
  title = { {TF-Agents}: A library for Reinforcement Learning in TensorFlow},
  author = {Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and
     Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and
     Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and
     Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and
     Vincent Vanhoucke and Eugene Brevdo},
  howpublished = {\url{https://github.com/tensorflow/agents} },
  url = "https://github.com/tensorflow/agents",
  year = 2018,
  note = "[Online; accessed 25-June-2019]"
}