Esta página foi traduzida pela API Cloud Translation.
Switch to English

Agentes TensorFlow

Aprendizado por reforço com o TensorFlow

O Agents facilita o projeto, a implementação e o teste de novos algoritmos de RL, fornecendo componentes modulares bem testados que podem ser modificados e estendidos. Ele permite iteração rápida de código, com boa integração de teste e benchmarking.

Para começar, recomendamos consultar um de nossos tutoriais .

Instalação

Os agentes TF publicam versões noturnas e estáveis. Para obter uma lista de lançamentos, leia a seção Lançamentos . Os comandos abaixo abrangem a instalação de agentes TF de maneira estável e noturna a partir do pypi.org , bem como de um clone do GitHub.

Estábulo

Execute os comandos abaixo para instalar a versão estável mais recente (0.5.0), testada com o TensorFlow 2.2.xe o Python3.

 pip install --user tf-agents
pip install --user tensorflow==2.2.0

# To get the matching examples and colabs
git clone https://github.com/tensorflow/agents.git
cd agents
git checkout v0.5.0

 

Se você deseja usar agentes TF com o TensorFlow 1.15 ou 2.0, instale a versão 0.3.0:

 pip install tf-agents==0.3.0
# Newer versions of tensorflow-probability require newer versions of TensorFlow.
pip install tensorflow-probability==0.8.0
 

Nightly

As compilações noturnas incluem recursos mais novos, mas podem ser menos estáveis ​​que as versões. A compilação noturna é enviada como tf-agents-nightly . Sugerimos a instalação de versões noturnas do TensorFlow ( tf-nightly ) e TensorFlow Probability ( tfp-nightly ), pois essas são as versões noturnas dos agentes TF que são testadas.

Para instalar a versão noturna, execute o seguinte:

 # Installing with the `--upgrade` flag ensures you'll get the latest version.
pip install --user --upgrade tf-agents-nightly  # depends on tf-nightly
# `--force-reinstall helps guarantee the right version.
pip install --user --force-reinstall tf-nightly
pip install --user --force-reinstall tfp-nightly
 

Do GitHub

Após a clonagem do repositório, as dependências podem ser instaladas executando pip install -e .[tests] . O TensorFlow precisa ser instalado de forma independente: pip install --user tf-nightly .

Contribuindo

Estamos ansiosos para colaborar com você! Consulte CONTRIBUTING.md para obter um guia sobre como contribuir. Este projeto segue o código de conduta da TensorFlow. Ao participar, espera-se que você defenda esse código.

Lançamentos

Os agentes TF têm lançamentos estáveis ​​e noturnos. Os lançamentos noturnos geralmente são bons, mas podem ter problemas devido ao fluxo de bibliotecas upstream. A tabela abaixo lista as versões do TensorFlow testadas com a liberação de cada TF Agent para ajudar os usuários que podem estar bloqueados em uma versão específica do TensorFlow.

Liberação Filial / Tag Versão TensorFlow
Nightly mestre todas as noites
0.5.0 v0.5.0 2.2.0
0.4.0 v0.4.0 2.1.0
0.3.0 v0.3.0 1.15.0 e 2.0.0

Exemplos de instalação noturna, mais recente estável e uma versão específica do TF-Agents:

 # Stable
pip install tf-agents

# Nightly
pip install tf-agents-nightly

# Specific version
pip install tf-agents==0.3.0

 

Princípios

Este projeto segue os princípios de IA do Google . Ao participar, usar ou contribuir com este projeto, você deverá aderir a esses princípios.

Citação

Se você usar esse código, cite-o como:

 @misc{TFAgents,
  title = { {TF-Agents}: A library for Reinforcement Learning in TensorFlow},
  author = "{Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and
     Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and
     Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and
     Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and
     Vincent Vanhoucke and Eugene Brevdo}",
  howpublished = {\url{https://github.com/tensorflow/agents} },
  url = "https://github.com/tensorflow/agents",
  year = 2018,
  note = "[Online; accessed 25-June-2019]"
}