rlu_atari_checkpoints_ordered

संग्रह की मदद से व्यवस्थित रहें अपनी प्राथमिकताओं के आधार पर, कॉन्टेंट को सेव करें और कैटगरी में बांटें.

  • विवरण :

आरएल अनप्लग्ड ऑफ़लाइन सुदृढीकरण सीखने के लिए बेंचमार्क का सूट है। आरएल अनप्लग्ड को निम्नलिखित विचारों के आसपास डिज़ाइन किया गया है: उपयोग में आसानी की सुविधा के लिए, हम एक एकीकृत एपीआई के साथ डेटासेट प्रदान करते हैं जो एक सामान्य पाइपलाइन स्थापित होने के बाद व्यवसायी के लिए सूट में सभी डेटा के साथ काम करना आसान बनाता है।

डेटासेट चरणों और एपिसोड का प्रतिनिधित्व करने के लिए आरएलडीएस प्रारूप का पालन करते हैं।

हम अग्रवाल एट अल।, 2020 द्वारा वर्णित प्रोटोकॉल का पालन करते हुए गेमप्ले का एक बड़ा और विविध डेटासेट जारी कर रहे हैं, जिसका उपयोग कई असतत ऑफ़लाइन आरएल एल्गोरिदम का मूल्यांकन करने के लिए किया जा सकता है। डेटासेट एक ऑनलाइन DQN एजेंट चलाकर और स्टिकी क्रियाओं Machado et al।, 2018 के साथ प्रशिक्षण के दौरान इसके रीप्ले से ट्रांज़िशन रिकॉर्ड करके तैयार किया गया है। जैसा कि अग्रवाल एट अल।, 2020 में कहा गया है, प्रत्येक खेल के लिए हम 50 मिलियन संक्रमणों के साथ 5 रन के डेटा का उपयोग करते हैं। हम 46 अटारी खेलों के लिए डेटासेट जारी करते हैं। डेटासेट कैसे बनाया गया था, इसके विवरण के लिए, कृपया पेपर देखें।

अटारी एक मानक आरएल बेंचमार्क है। हम अनुशंसा करते हैं कि आप अटारी पर ऑफ़लाइन आरएल विधियों का प्रयास करें यदि आप अलग-अलग कार्यों के साथ अन्य अत्याधुनिक ऑफ़लाइन आरएल विधियों के साथ अपने दृष्टिकोण की तुलना करने में रुचि रखते हैं।

प्रत्येक चरण का इनाम क्लिप किया गया है ([-1, 1] क्लिपिंग के साथ प्राप्त किया गया है) और एपिसोड में प्रति एपिसोड क्लिप किए गए इनाम का योग शामिल है।

प्रत्येक विन्यास विभाजन में टूट गया है। विभाजन 1M चरणों की चौकियों के अनुरूप हैं (ध्यान दें कि एपिसोड की संख्या भिन्न हो सकती है)। चेकपॉइंट समय पर ऑर्डर किए जाते हैं (इसलिए चेकपॉइंट 0 चेकपॉइंट 1 से पहले चला गया)।

प्रत्येक विभाजन के भीतर एपिसोड का आदेश दिया जाता है। यदि आप सुनिश्चित करना चाहते हैं कि आप एपिसोड को क्रम से पढ़ रहे हैं तो https://www.tensorflow.org/datasets/determinism देखें

यह डेटासेट DQN रीप्ले पेपर में उपयोग किए गए डेटासेट से मेल खाता है। https://research.google/tools/datasets/dqn-replay/

विभाजित करना उदाहरण
  • फ़ीचर संरचना :
FeaturesDict({
    'checkpoint_id': tf.int64,
    'episode_id': tf.int64,
    'episode_return': Scalar(shape=(), dtype=tf.float32),
    'steps': Dataset({
        'action': tf.int64,
        'discount': tf.float32,
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': Image(shape=(84, 84, 1), dtype=tf.uint8),
        'reward': Scalar(shape=(), dtype=tf.float32),
    }),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण मूल्य पहुंच
विशेषताएंडिक्ट
चेकपॉइंट_आईडी टेन्सर tf.int64
एपिसोड_आईडी टेन्सर tf.int64
एपिसोड_रिटर्न अदिश tf.float32 क्लिप किए गए पुरस्कारों का योग।
कदम डेटासेट
कदम / क्रिया टेन्सर tf.int64
कदम/छूट टेन्सर tf.float32
चरण/is_first टेन्सर tf.बूल
चरण/is_last टेन्सर tf.बूल
चरण/is_terminal टेन्सर tf.बूल
कदम/अवलोकन छवि (84, 84, 1) tf.uint8
कदम/इनाम अदिश tf.float32 कटा हुआ इनाम। [-11]
  • पर्यवेक्षित कुंजी ( as_supervised doc देखें): None

  • चित्र ( tfds.show_examples ): समर्थित नहीं है।

  • उद्धरण :

@misc{gulcehre2020rl,
    title={RL Unplugged: Benchmarks for Offline Reinforcement Learning},
    author={Caglar Gulcehre and Ziyu Wang and Alexander Novikov and Tom Le Paine
        and  Sergio Gómez Colmenarejo and Konrad Zolna and Rishabh Agarwal and
        Josh Merel and Daniel Mankowitz and Cosmin Paduraru and Gabriel
        Dulac-Arnold and Jerry Li and Mohammad Norouzi and Matt Hoffman and
        Ofir Nachum and George Tucker and Nicolas Heess and Nando deFreitas},
    year={2020},
    eprint={2006.13888},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

rlu_atari_checkpoints_ordered/Alien_run_1 (डिफ़ॉल्ट कॉन्फ़िगरेशन)

rlu_atari_checkpoints_ordered/Alien_run_2

rlu_atari_checkpoints_ordered/Alien_run_3

rlu_atari_checkpoints_ordered/Alien_run_4

rlu_atari_checkpoints_ordered/Alien_run_5

rlu_atari_checkpoints_ordered/Amidar_run_1

rlu_atari_checkpoints_ordered/Amidar_run_2

rlu_atari_checkpoints_ordered/Amidar_run_3

rlu_atari_checkpoints_ordered/Amidar_run_4

rlu_atari_checkpoints_ordered/Amidar_run_5

rlu_atari_checkpoints_ordered/Assault_run_1

rlu_atari_checkpoints_ordered/Assault_run_2

rlu_atari_checkpoints_ordered/Assault_run_3

rlu_atari_checkpoints_ordered/Assault_run_4

rlu_atari_checkpoints_ordered/Assault_run_5

rlu_atari_checkpoints_ordered/Asterix_run_1

rlu_atari_checkpoints_ordered/Asterix_run_2

rlu_atari_checkpoints_ordered/Asterix_run_3

rlu_atari_checkpoints_ordered/Asterix_run_4

rlu_atari_checkpoints_ordered/Asterix_run_5

rlu_atari_checkpoints_ordered/Atlantis_run_1

rlu_atari_checkpoints_ordered/Atlantis_run_2

rlu_atari_checkpoints_ordered/Atlantis_run_3

rlu_atari_checkpoints_ordered/Atlantis_run_4

rlu_atari_checkpoints_ordered/Atlantis_run_5

rlu_atari_checkpoints_ordered/BankHeist_run_1

rlu_atari_checkpoints_ordered/BankHeist_run_2

rlu_atari_checkpoints_ordered/BankHeist_run_3

rlu_atari_checkpoints_ordered/BankHeist_run_4

rlu_atari_checkpoints_ordered/BankHeist_run_5

rlu_atari_checkpoints_ordered/BattleZone_run_1

rlu_atari_checkpoints_ordered/BattleZone_run_2

rlu_atari_checkpoints_ordered/BattleZone_run_3

rlu_atari_checkpoints_ordered/BattleZone_run_4

rlu_atari_checkpoints_ordered/BattleZone_run_5

rlu_atari_checkpoints_ordered/BeamRider_run_1

rlu_atari_checkpoints_ordered/BeamRider_run_2

rlu_atari_checkpoints_ordered/BeamRider_run_3

rlu_atari_checkpoints_ordered/BeamRider_run_4

rlu_atari_checkpoints_ordered/BeamRider_run_5

rlu_atari_checkpoints_ordered/Boxing_run_1

rlu_atari_checkpoints_ordered/Boxing_run_2

rlu_atari_checkpoints_ordered/Boxing_run_3

rlu_atari_checkpoints_ordered/Boxing_run_4

rlu_atari_checkpoints_ordered/Boxing_run_5

rlu_atari_checkpoints_ordered/Breakout_run_1

rlu_atari_checkpoints_ordered/Breakout_run_2

rlu_atari_checkpoints_ordered/Breakout_run_3

rlu_atari_checkpoints_ordered/Breakout_run_4

rlu_atari_checkpoints_ordered/Breakout_run_5

rlu_atari_checkpoints_ordered/Carnival_run_1

rlu_atari_checkpoints_ordered/Carnival_run_2

rlu_atari_checkpoints_ordered/Carnival_run_3

rlu_atari_checkpoints_ordered/Carnival_run_4

rlu_atari_checkpoints_ordered/Carnival_run_5

rlu_atari_checkpoints_ordered/Centipede_run_1

rlu_atari_checkpoints_ordered/Centipede_run_2

rlu_atari_checkpoints_ordered/Centipede_run_3

rlu_atari_checkpoints_ordered/Centipede_run_4

rlu_atari_checkpoints_ordered/Centipede_run_5

rlu_atari_checkpoints_ordered/ChopperCommand_run_1

rlu_atari_checkpoints_ordered/ChopperCommand_run_2

rlu_atari_checkpoints_ordered/ChopperCommand_run_3

rlu_atari_checkpoints_ordered/ChopperCommand_run_4

rlu_atari_checkpoints_ordered/ChopperCommand_run_5

rlu_atari_checkpoints_ordered/CrazyClimber_run_1

rlu_atari_checkpoints_ordered/CrazyClimber_run_2

rlu_atari_checkpoints_ordered/CrazyClimber_run_3

rlu_atari_checkpoints_ordered/CrazyClimber_run_4

rlu_atari_checkpoints_ordered/CrazyClimber_run_5

rlu_atari_checkpoints_ordered/DemonAttack_run_1

rlu_atari_checkpoints_ordered/DemonAttack_run_2

rlu_atari_checkpoints_ordered/DemonAttack_run_3

rlu_atari_checkpoints_ordered/DemonAttack_run_4

rlu_atari_checkpoints_ordered/DemonAttack_run_5

rlu_atari_checkpoints_ordered/DoubleDunk_run_1

rlu_atari_checkpoints_ordered/DoubleDunk_run_2

rlu_atari_checkpoints_ordered/DoubleDunk_run_3

rlu_atari_checkpoints_ordered/DoubleDunk_run_4

rlu_atari_checkpoints_ordered/DoubleDunk_run_5

rlu_atari_checkpoints_ordered/Enduro_run_1

rlu_atari_checkpoints_ordered/Enduro_run_2

rlu_atari_checkpoints_ordered/Enduro_run_3

rlu_atari_checkpoints_ordered/Enduro_run_4

rlu_atari_checkpoints_ordered/Enduro_run_5

rlu_atari_checkpoints_ordered/FishingDerby_run_1

rlu_atari_checkpoints_ordered/FishingDerby_run_2

rlu_atari_checkpoints_ordered/FishingDerby_run_3

rlu_atari_checkpoints_ordered/FishingDerby_run_4

rlu_atari_checkpoints_ordered/FishingDerby_run_5

rlu_atari_checkpoints_ordered/Freeway_run_1

rlu_atari_checkpoints_ordered/Freeway_run_2

rlu_atari_checkpoints_ordered/Freeway_run_3

rlu_atari_checkpoints_ordered/Freeway_run_4

rlu_atari_checkpoints_ordered/Freeway_run_5

rlu_atari_checkpoints_ordered/Frostbite_run_1

rlu_atari_checkpoints_ordered/Frostbite_run_2

rlu_atari_checkpoints_ordered/Frostbite_run_3

rlu_atari_checkpoints_ordered/Frostbite_run_4

rlu_atari_checkpoints_ordered/Frostbite_run_5

rlu_atari_checkpoints_ordered/Gopher_run_1

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Gopher_run_2

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Gopher_run_3

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Gopher_run_4

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Gopher_run_5

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Gravitar_run_1

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Gravitar_run_2

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Gravitar_run_3

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Gravitar_run_4

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Gravitar_run_5

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Hero_run_1

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Hero_run_2

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Hero_run_3

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Hero_run_4

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Hero_run_5

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/IceHockey_run_1

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/IceHockey_run_2

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/IceHockey_run_3

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/IceHockey_run_4

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/IceHockey_run_5

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Jamesbond_run_1

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Jamesbond_run_2

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Jamesbond_run_3

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Jamesbond_run_4

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Jamesbond_run_5

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/कंगारू_रन_1

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/कंगारू_रन_2

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/कंगारू_रन_3

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/कंगारू_रन_4

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/कंगारू_रन_5

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Krull_run_1

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Krull_run_2

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Krull_run_3

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Krull_run_4

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Krull_run_5

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/KungFuMaster_run_1

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/KungFuMaster_run_2

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/KungFuMaster_run_3

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/KungFuMaster_run_4

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/KungFuMaster_run_5

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/MsPacman_run_1

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/MsPacman_run_2

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/MsPacman_run_3

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/MsPacman_run_4

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/MsPacman_run_5

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/NameThisGame_run_1

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/NameThisGame_run_2

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/NameThisGame_run_3

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/NameThisGame_run_4

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/NameThisGame_run_5

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Phoenix_run_1

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Phoenix_run_2

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Phoenix_run_3

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Phoenix_run_4

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Phoenix_run_5

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Pong_run_1

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Pong_run_2

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Pong_run_3

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Pong_run_4

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Pong_run_5

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Pooyan_run_1

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Pooyan_run_2

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Pooyan_run_3

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Pooyan_run_4

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Pooyan_run_5

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Qbert_run_1

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Qbert_run_2

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Qbert_run_3

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Qbert_run_4

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Qbert_run_5

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Riverraid_run_1

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Riverraid_run_2

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Riverraid_run_3

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Riverraid_run_4

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Riverraid_run_5

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/RoadRunner_run_1

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/RoadRunner_run_2

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/RoadRunner_run_3

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/RoadRunner_run_4

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/RoadRunner_run_5

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Robotank_run_1

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Robotank_run_2

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Robotank_run_3

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Robotank_run_4

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Robotank_run_5

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Seaquest_run_1

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Seaquest_run_2

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Seaquest_run_3

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Seaquest_run_4

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Seaquest_run_5

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/SpaceInvaders_run_1

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/SpaceInvaders_run_2

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/SpaceInvaders_run_3

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/SpaceInvaders_run_4

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/SpaceInvaders_run_5

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/StarGunner_run_1

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/StarGunner_run_2

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/StarGunner_run_3

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/StarGunner_run_4

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/StarGunner_run_5

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/TimePilot_run_1

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/TimePilot_run_2

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/TimePilot_run_3

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/TimePilot_run_4

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/TimePilot_run_5

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/UpNDdown_run_1

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/UpNDdown_run_2

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/UpNDdown_run_3

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/UpNDdown_run_4

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/UpNDdown_run_5

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/वीडियोपिनबॉल_रन_1

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/वीडियोपिनबॉल_रन_2

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/वीडियोपिनबॉल_रन_3

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/वीडियोपिनबॉल_रन_4

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/वीडियोपिनबॉल_रन_5

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/WizardOfWor_run_1

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/WizardOfWor_run_2

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/WizardOfWor_run_3

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/WizardOfWor_run_4

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/WizardOfWor_run_5

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/YarsRevenge_run_1

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/YarsRevenge_run_2

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/YarsRevenge_run_3

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/YarsRevenge_run_4

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/YarsRevenge_run_5

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Zaxxon_run_1

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Zaxxon_run_2

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Zaxxon_run_3

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Zaxxon_run_4

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।

rlu_atari_checkpoints_ordered/Zaxxon_run_5

  • उदाहरण ( tfds.as_dataframe ): केवल पहले 100 कॉन्फ़िगरेशन के लिए दिखाया गया है।