टेंसरफ्लो एजेंट

संग्रह की मदद से व्यवस्थित रहें अपनी प्राथमिकताओं के आधार पर, कॉन्टेंट को सेव करें और कैटगरी में बांटें.

TensorFlow के साथ रीइन्फोर्समेंट लर्निंग

एजेंट अच्छी तरह से परीक्षित मॉड्यूलर घटक प्रदान करके नए आरएल एल्गोरिदम को डिजाइन करना, कार्यान्वित करना और परीक्षण करना आसान बनाता है जिसे संशोधित और विस्तारित किया जा सकता है। यह अच्छे परीक्षण एकीकरण और बेंचमार्किंग के साथ तेज़ कोड पुनरावृति को सक्षम बनाता है।

आरंभ करने के लिए, हम अनुशंसा करते हैं कि आप अपना कोई ट्यूटोरियल देखें

इंस्टालेशन

TF-एजेंट हर रात और स्थिर बिल्ड प्रकाशित करते हैं। रिलीज़ की सूची के लिए रिलीज़ सेक्शन पढ़ें। नीचे दिए गए आदेश TF-एजेंट को स्थिर और रात में pypi.org के साथ-साथ GitHub क्लोन से स्थापित करने को कवर करते हैं।

स्थिर

नवीनतम स्थिर रिलीज़ को स्थापित करने के लिए नीचे दिए गए आदेश चलाएँ। रिलीज के लिए एपीआई दस्तावेज Tensorflow.org पर है।

$ pip install --user tf-agents[reverb]

# Use this tag get the matching examples and colabs.
$ git clone https://github.com/tensorflow/agents.git
$ cd agents
$ git checkout v0.15.0

यदि आप Tensorflow या Reverb के संस्करणों के साथ TF-एजेंट स्थापित करना चाहते हैं, जिन्हें पाइप निर्भरता जाँच द्वारा संगत नहीं के रूप में फ़्लैग किया गया है, तो नीचे दिए गए पैटर्न का उपयोग अपने जोखिम पर करें।

$ pip install --user tensorflow
$ pip install --user dm-reverb
$ pip install --user tf-agents

यदि आप TensorFlow 1.15 या 2.0 के साथ TF-एजेंट का उपयोग करना चाहते हैं, तो संस्करण 0.3.0 स्थापित करें:

# Newer versions of tensorflow-probability require newer versions of TensorFlow.
$ pip install tensorflow-probability==0.8.0
$ pip install tf-agents==0.3.0

हर रात को

नाइटली बिल्ड में नई सुविधाएँ शामिल हैं, लेकिन संस्करणित रिलीज़ की तुलना में कम स्थिर हो सकती हैं। नाइटली बिल्ड को tf-agents-nightly रूप में पुश किया जाता है। हमारा सुझाव है कि TensorFlow ( tf-nightly ) और TensorFlow Probability ( tfp-nightly ) के रात्रिकालीन संस्करण स्थापित करें क्योंकि ये TF-एजेंट के रात्रिकालीन संस्करण हैं जिनके विरुद्ध परीक्षण किया जाता है।

रात्रि निर्माण संस्करण को स्थापित करने के लिए, निम्नलिखित को चलाएँ:

# `--force-reinstall helps guarantee the right versions.
$ pip install --user --force-reinstall tf-nightly
$ pip install --user --force-reinstall tfp-nightly
$ pip install --user --force-reinstall dm-reverb-nightly

# Installing with the `--upgrade` flag ensures you'll get the latest version.
$ pip install --user --upgrade tf-agents-nightly

गिटहब से

रिपॉजिटरी की क्लोनिंग के बाद, निर्भरताएँ pip install -e .[tests] चलाकर स्थापित की जा सकती हैं। TensorFlow को स्वतंत्र रूप से स्थापित करने की आवश्यकता है: pip install --user tf-nightly

योगदान

हम आपके साथ सहयोग करने के लिए उत्सुक हैं! योगदान करने के तरीके के बारे में गाइड के लिए CONTRIBUTING.md देखें। यह प्रोजेक्ट TensorFlow की आचार संहिता का पालन करता है। भाग लेने से, आपसे इस कोड को बनाए रखने की अपेक्षा की जाती है।

विज्ञप्ति

TF एजेंटों के स्थिर और रात्रिकालीन रिलीज़ होते हैं। रात्रिकालीन रिलीज़ अक्सर ठीक होती हैं लेकिन अपस्ट्रीम लाइब्रेरी के प्रवाह में होने के कारण समस्याएँ हो सकती हैं। नीचे दी गई तालिका में TensorFlow के संस्करण (संस्करणों) को प्रत्येक TF एजेंटों की रिलीज़ के साथ परीक्षण किया गया है ताकि उपयोगकर्ताओं की मदद की जा सके जो TensorFlow के एक विशिष्ट संस्करण में लॉक हो सकते हैं। 0.9.0 Python 3.6 के साथ संगत अंतिम रिलीज़ थी। 0.3.0 Python 2 के साथ संगत अंतिम रिलीज़ थी।

रिहाई शाखा / टैग टेंसरफ्लो संस्करण डीएम-रीवरब संस्करण
हर रात को गुरुजी tf-nightly dm-reverb-nightly
0.15.0 v0.15.0 2.11.0 0.10.0
0.14.0 v0.14.0 2.10.0 0.9.0
0.13.0 v0.13.0 2.9.0 0.8.0
0.12.0 v0.12.0 2.8.0 0.7.0
0.11.0 v0.11.0 2.7.0 0.6.0
0.10.0 v0.10.0 2.6.0
0.9.0 v0.9.0 2.6.0
0.8.0 v0.8.0 2.5.0
0.7.1 v0.7.1 2.4.0
0.6.0 v0.6.0 2.3.0
0.5.0 v0.5.0 2.2.0
0.4.0 v0.4.0 2.1.0
0.3.0 v0.3.0 1.15.0 और 2.0.0।

सिद्धांतों

यह प्रोजेक्ट Google के AI सिद्धांतों का पालन करता है। इस परियोजना में भाग लेने, उपयोग करने या योगदान देने से आपसे इन सिद्धांतों का पालन करने की अपेक्षा की जाती है।

उद्धरण

यदि आप इस कोड का उपयोग करते हैं, तो कृपया इसे इस रूप में उद्धृत करें:

@misc{TFAgents,
  title = { {TF-Agents}: A library for Reinforcement Learning in TensorFlow},
  author = {Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and
     Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and
     Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and
     Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and
     Vincent Vanhoucke and Eugene Brevdo},
  howpublished = {\url{https://github.com/tensorflow/agents} },
  url = "https://github.com/tensorflow/agents",
  year = 2018,
  note = "[Online; accessed 25-June-2019]"
}