- विवरण :
आरएल अनप्लग्ड ऑफ़लाइन सुदृढीकरण सीखने के लिए बेंचमार्क का सूट है। आरएल अनप्लग्ड को निम्नलिखित विचारों के आसपास डिज़ाइन किया गया है: उपयोग में आसानी की सुविधा के लिए, हम एक एकीकृत एपीआई के साथ डेटासेट प्रदान करते हैं जो एक सामान्य पाइपलाइन स्थापित होने के बाद व्यवसायी के लिए सूट में सभी डेटा के साथ काम करना आसान बनाता है।
डेटासेट चरणों और एपिसोड का प्रतिनिधित्व करने के लिए आरएलडीएस प्रारूप का पालन करते हैं।
हम अग्रवाल एट अल।, 2020 द्वारा वर्णित प्रोटोकॉल का पालन करते हुए गेमप्ले का एक बड़ा और विविध डेटासेट जारी कर रहे हैं, जिसका उपयोग कई असतत ऑफ़लाइन आरएल एल्गोरिदम का मूल्यांकन करने के लिए किया जा सकता है। डेटासेट एक ऑनलाइन DQN एजेंट चलाकर और स्टिकी क्रियाओं Machado et al।, 2018 के साथ प्रशिक्षण के दौरान इसके रीप्ले से ट्रांज़िशन रिकॉर्ड करके तैयार किया गया है। जैसा कि अग्रवाल एट अल।, 2020 में कहा गया है, प्रत्येक खेल के लिए हम 50 मिलियन संक्रमणों के साथ 5 रन के डेटा का उपयोग करते हैं। हम 46 अटारी खेलों के लिए डेटासेट जारी करते हैं। डेटासेट कैसे बनाया गया था, इसके विवरण के लिए, कृपया पेपर देखें।
अटारी एक मानक आरएल बेंचमार्क है। हम अनुशंसा करते हैं कि आप अटारी पर ऑफ़लाइन आरएल विधियों का प्रयास करें यदि आप अलग-अलग कार्यों के साथ अन्य अत्याधुनिक ऑफ़लाइन आरएल विधियों के साथ अपने दृष्टिकोण की तुलना करने में रुचि रखते हैं।
प्रत्येक चरण का इनाम क्लिप किया गया है ([-1, 1] क्लिपिंग के साथ प्राप्त किया गया है) और एपिसोड में प्रति एपिसोड क्लिप किए गए इनाम का योग शामिल है।
प्रत्येक विन्यास विभाजन में टूट गया है। विभाजन 1M चरणों की चौकियों के अनुरूप हैं (ध्यान दें कि एपिसोड की संख्या भिन्न हो सकती है)। चेकपॉइंट समय पर ऑर्डर किए जाते हैं (इसलिए चेकपॉइंट 0 चेकपॉइंट 1 से पहले चला गया)।
प्रत्येक विभाजन के भीतर एपिसोड का आदेश दिया जाता है। यदि आप सुनिश्चित करना चाहते हैं कि आप एपिसोड को क्रम से पढ़ रहे हैं तो https://www.tensorflow.org/datasets/determinism देखें ।
यह डेटासेट DQN रीप्ले पेपर में उपयोग किए गए डेटासेट से मेल खाता है। https://research.google/tools/datasets/dqn-replay/
होमपेज : https://github.com/deepmind/deepmind-research/tree/master/rl_unplugged
स्रोत कोड :
tfds.rl_unplugged.rlu_atari_checkpoints_ordered.RluAtariCheckpointsOrdered
संस्करण :
-
1.0.0
: प्रारंभिक रिलीज। -
1.1.0
(डिफ़ॉल्ट): हटाए गए अनावश्यक क्लिप किए गए इनाम फ़ील्ड।
-
डाउनलोड आकार :
Unknown size
डेटासेट का आकार :
Unknown size
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): अज्ञात
विभाजन :
विभाजित करना | उदाहरण |
---|
- फ़ीचर संरचना :
FeaturesDict({
'checkpoint_id': tf.int64,
'episode_id': tf.int64,
'episode_return': Scalar(shape=(), dtype=tf.float32),
'steps': Dataset({
'action': tf.int64,
'discount': tf.float32,
'is_first': tf.bool,
'is_last': tf.bool,
'is_terminal': tf.bool,
'observation': Image(shape=(84, 84, 1), dtype=tf.uint8),
'reward': Scalar(shape=(), dtype=tf.float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण | मूल्य पहुंच |
---|---|---|---|---|---|
विशेषताएंडिक्ट | |||||
चेकपॉइंट_आईडी | टेन्सर | tf.int64 | |||
एपिसोड_आईडी | टेन्सर | tf.int64 | |||
एपिसोड_रिटर्न | अदिश | tf.float32 | क्लिप किए गए पुरस्कारों का योग। | ||
कदम | डेटासेट | ||||
कदम / क्रिया | टेन्सर | tf.int64 | |||
कदम/छूट | टेन्सर | tf.float32 | |||
चरण/is_first | टेन्सर | tf.बूल | |||
चरण/is_last | टेन्सर | tf.बूल | |||
चरण/is_terminal | टेन्सर | tf.बूल | |||
कदम/अवलोकन | छवि | (84, 84, 1) | tf.uint8 | ||
कदम/इनाम | अदिश | tf.float32 | कटा हुआ इनाम। | [-11] |
पर्यवेक्षित कुंजी (
as_supervised
doc देखें):None
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उद्धरण :
@misc{gulcehre2020rl,
title={RL Unplugged: Benchmarks for Offline Reinforcement Learning},
author={Caglar Gulcehre and Ziyu Wang and Alexander Novikov and Tom Le Paine
and Sergio Gómez Colmenarejo and Konrad Zolna and Rishabh Agarwal and
Josh Merel and Daniel Mankowitz and Cosmin Paduraru and Gabriel
Dulac-Arnold and Jerry Li and Mohammad Norouzi and Matt Hoffman and
Ofir Nachum and George Tucker and Nicolas Heess and Nando deFreitas},
year={2020},
eprint={2006.13888},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
rlu_atari_checkpoints_ordered/Alien_run_1 (डिफ़ॉल्ट कॉन्फ़िगरेशन)
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Alien_run_2
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Alien_run_3
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Alien_run_4
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Alien_run_5
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Amidar_run_1
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Amidar_run_2
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Amidar_run_3
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Amidar_run_4
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Amidar_run_5
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Assault_run_1
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Assault_run_2
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Assault_run_3
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Assault_run_4
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Assault_run_5
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Asterix_run_1
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Asterix_run_2
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Asterix_run_3
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Asterix_run_4
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Asterix_run_5
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Atlantis_run_1
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Atlantis_run_2
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Atlantis_run_3
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Atlantis_run_4
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Atlantis_run_5
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BankHeist_run_1
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BankHeist_run_2
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BankHeist_run_3
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BankHeist_run_4
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BankHeist_run_5
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BattleZone_run_1
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BattleZone_run_2
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BattleZone_run_3
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BattleZone_run_4
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BattleZone_run_5
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BeamRider_run_1
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BeamRider_run_2
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BeamRider_run_3
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BeamRider_run_4
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BeamRider_run_5
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Boxing_run_1
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Boxing_run_2
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Boxing_run_3
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Boxing_run_4
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Boxing_run_5
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Breakout_run_1
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Breakout_run_2
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Breakout_run_3
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Breakout_run_4
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Breakout_run_5
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Carnival_run_1
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Carnival_run_2
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Carnival_run_3
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Carnival_run_4
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Carnival_run_5
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Centipede_run_1
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Centipede_run_2
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Centipede_run_3
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Centipede_run_4
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Centipede_run_5
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/ChopperCommand_run_1
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/ChopperCommand_run_2
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/ChopperCommand_run_3
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/ChopperCommand_run_4
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/ChopperCommand_run_5
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/CrazyClimber_run_1
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/CrazyClimber_run_2
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/CrazyClimber_run_3
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/CrazyClimber_run_4
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/CrazyClimber_run_5
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/DemonAttack_run_1
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/DemonAttack_run_2
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/DemonAttack_run_3
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/DemonAttack_run_4
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/DemonAttack_run_5
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/DoubleDunk_run_1
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/DoubleDunk_run_2
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/DoubleDunk_run_3
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/DoubleDunk_run_4
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/DoubleDunk_run_5
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Enduro_run_1
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Enduro_run_2
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Enduro_run_3
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Enduro_run_4
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Enduro_run_5
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/FishingDerby_run_1
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/FishingDerby_run_2
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/FishingDerby_run_3
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/FishingDerby_run_4
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/FishingDerby_run_5
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Freeway_run_1
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Freeway_run_2
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Freeway_run_3
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Freeway_run_4
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Freeway_run_5
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Frostbite_run_1
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Frostbite_run_2
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Frostbite_run_3
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Frostbite_run_4
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Frostbite_run_5
- उदाहरण ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Gopher_run_1
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Gopher_run_2
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Gopher_run_3
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Gopher_run_4
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Gopher_run_5
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Gravitar_run_1
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Gravitar_run_2
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Gravitar_run_3
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Gravitar_run_4
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Gravitar_run_5
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Hero_run_1
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Hero_run_2
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Hero_run_3
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Hero_run_4
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Hero_run_5
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/IceHockey_run_1
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/IceHockey_run_2
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/IceHockey_run_3
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/IceHockey_run_4
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/IceHockey_run_5
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Jamesbond_run_1
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Jamesbond_run_2
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Jamesbond_run_3
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Jamesbond_run_4
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Jamesbond_run_5
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/कंगारू_रन_1
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/कंगारू_रन_2
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/कंगारू_रन_3
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/कंगारू_रन_4
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/कंगारू_रन_5
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Krull_run_1
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Krull_run_2
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Krull_run_3
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Krull_run_4
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Krull_run_5
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/KungFuMaster_run_1
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/KungFuMaster_run_2
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/KungFuMaster_run_3
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/KungFuMaster_run_4
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/KungFuMaster_run_5
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/MsPacman_run_1
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/MsPacman_run_2
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/MsPacman_run_3
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/MsPacman_run_4
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/MsPacman_run_5
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/NameThisGame_run_1
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/NameThisGame_run_2
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/NameThisGame_run_3
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/NameThisGame_run_4
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/NameThisGame_run_5
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Phoenix_run_1
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Phoenix_run_2
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Phoenix_run_3
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Phoenix_run_4
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Phoenix_run_5
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Pong_run_1
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Pong_run_2
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Pong_run_3
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Pong_run_4
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Pong_run_5
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Pooyan_run_1
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Pooyan_run_2
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Pooyan_run_3
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Pooyan_run_4
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Pooyan_run_5
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Qbert_run_1
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Qbert_run_2
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Qbert_run_3
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Qbert_run_4
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Qbert_run_5
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Riverraid_run_1
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Riverraid_run_2
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Riverraid_run_3
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Riverraid_run_4
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Riverraid_run_5
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/RoadRunner_run_1
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/RoadRunner_run_2
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/RoadRunner_run_3
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/RoadRunner_run_4
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/RoadRunner_run_5
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Robotank_run_1
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Robotank_run_2
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Robotank_run_3
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Robotank_run_4
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Robotank_run_5
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Seaquest_run_1
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Seaquest_run_2
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Seaquest_run_3
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Seaquest_run_4
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Seaquest_run_5
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/SpaceInvaders_run_1
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/SpaceInvaders_run_2
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/SpaceInvaders_run_3
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/SpaceInvaders_run_4
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/SpaceInvaders_run_5
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/StarGunner_run_1
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/StarGunner_run_2
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/StarGunner_run_3
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/StarGunner_run_4
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/StarGunner_run_5
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/TimePilot_run_1
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/TimePilot_run_2
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/TimePilot_run_3
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/TimePilot_run_4
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/TimePilot_run_5
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/UpNDdown_run_1
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/UpNDdown_run_2
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/UpNDdown_run_3
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/UpNDdown_run_4
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/UpNDdown_run_5
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/वीडियोपिनबॉल_रन_1
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/वीडियोपिनबॉल_रन_2
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/वीडियोपिनबॉल_रन_3
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/वीडियोपिनबॉल_रन_4
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/वीडियोपिनबॉल_रन_5
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/WizardOfWor_run_1
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/WizardOfWor_run_2
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/WizardOfWor_run_3
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/WizardOfWor_run_4
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/WizardOfWor_run_5
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/YarsRevenge_run_1
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/YarsRevenge_run_2
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/YarsRevenge_run_3
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/YarsRevenge_run_4
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/YarsRevenge_run_5
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Zaxxon_run_1
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Zaxxon_run_2
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Zaxxon_run_3
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Zaxxon_run_4
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।
rlu_atari_checkpoints_ordered/Zaxxon_run_5
- उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।