ช่วยปกป้อง Great Barrier Reef กับ TensorFlow บน Kaggle เข้าร่วมท้าทาย

rlu_atari_checkpoints

 • รายละเอียด:

RL Unplugged เป็นชุดของการวัดประสิทธิภาพสำหรับการเรียนรู้การเสริมแรงแบบออฟไลน์ RL Unplugged ได้รับการออกแบบโดยคำนึงถึงข้อควรพิจารณาต่อไปนี้: เพื่อให้ง่ายต่อการใช้งาน เราจัดเตรียมชุดข้อมูลด้วย API แบบรวมศูนย์ ซึ่งทำให้ผู้ปฏิบัติงานทำงานกับข้อมูลทั้งหมดในชุดโปรแกรมได้ง่ายเมื่อสร้างไปป์ไลน์ทั่วไปแล้ว

เราจะปล่อยชุดข้อมูลที่มีขนาดใหญ่และมีความหลากหลายของการเล่นเกมต่อไปนี้โปรโตคอลอธิบายโดย Agarwal et al., 2020 ซึ่งสามารถนำมาใช้ในการประเมินหลายขั้นตอนวิธีการที่ไม่ต่อเนื่อง RL ออฟไลน์ ชุดข้อมูลที่ถูกสร้างขึ้นโดยการทำงานเป็นตัวแทน DQN ออนไลน์และบันทึกการเปลี่ยนจากการเล่นใหม่ในช่วงการฝึกอบรมกับการกระทำเหนียว Machado et al., 2018 ตามที่ระบุใน Agarwal et al., 2020 สำหรับแต่ละเกมที่เราใช้ข้อมูลจากห้าวิ่งกับ 50 ล้านเปลี่ยนแต่ละ เราเผยแพร่ชุดข้อมูลสำหรับเกมอาตาริ 46 เกม สำหรับรายละเอียดเกี่ยวกับวิธีการสร้างชุดข้อมูล โปรดดูเอกสาร

Atari เป็นเกณฑ์มาตรฐาน RL เราขอแนะนำให้คุณลองใช้วิธี RL ออฟไลน์บน Atari หากคุณสนใจที่จะเปรียบเทียบแนวทางของคุณกับวิธี RL ออฟไลน์ที่ล้ำสมัยด้วยการดำเนินการที่ไม่ต่อเนื่อง

นอกจากรางวัลของแต่ละขั้นตอนแล้ว ชุดข้อมูลนี้ยังรวมถึงรางวัลที่ตัดแล้ว (ที่ได้รับด้วย [-1, 1] คลิป) และผลรวมของรางวัลที่ตัดมาต่อตอน

แยก ตัวอย่าง
 • คุณสมบัติ:
FeaturesDict({
  'checkpoint_id': tf.int64,
  'clipped_episode_return': tf.float32,
  'episode_id': tf.int64,
  'episode_return': tf.float32,
  'steps': Dataset({
    'action': tf.int64,
    'clipped_reward': tf.float32,
    'discount': tf.float32,
    'is_first': tf.bool,
    'is_last': tf.bool,
    'is_terminal': tf.bool,
    'observation': Image(shape=(84, 84, 1), dtype=tf.uint8),
    'reward': tf.float32,
  }),
})
 • คีย์ภายใต้การดูแล (ดู as_supervised doc ): None

 • รูป ( tfds.show_examples ): ไม่ได้รับการสนับสนุน

 • ตัวอย่าง ( tfds.as_dataframe ): หายไป

 • อ้างอิง:

@misc{gulcehre2020rl,
  title={RL Unplugged: Benchmarks for Offline Reinforcement Learning},
  author={Caglar Gulcehre and Ziyu Wang and Alexander Novikov and Tom Le Paine
    and Sergio Gómez Colmenarejo and Konrad Zolna and Rishabh Agarwal and
    Josh Merel and Daniel Mankowitz and Cosmin Paduraru and Gabriel
    Dulac-Arnold and Jerry Li and Mohammad Norouzi and Matt Hoffman and
    Ofir Nachum and George Tucker and Nicolas Heess and Nando deFreitas},
  year={2020},
  eprint={2006.13888},
  archivePrefix={arXiv},
  primaryClass={cs.LG}
}

rlu_atari_checkpoints/Alien_run_1 (การกำหนดค่าเริ่มต้น)

rlu_atari_checkpoints/Alien_run_2

rlu_atari_checkpoints/Alien_run_3

rlu_atari_checkpoints/Alien_run_4

rlu_atari_checkpoints/Alien_run_5

rlu_atari_checkpoints/Amidar_run_1

rlu_atari_checkpoints/Amidar_run_2

rlu_atari_checkpoints/Amidar_run_3

rlu_atari_checkpoints/Amidar_run_4

rlu_atari_checkpoints/Amidar_run_5

rlu_atari_checkpoints/Assault_run_1

rlu_atari_checkpoints/Assault_run_2

rlu_atari_checkpoints/Assault_run_3

rlu_atari_checkpoints/Assault_run_4

rlu_atari_checkpoints/Assault_run_5

rlu_atari_checkpoints/Asterix_run_1

rlu_atari_checkpoints/Asterix_run_2

rlu_atari_checkpoints/Asterix_run_3

rlu_atari_checkpoints/Asterix_run_4

rlu_atari_checkpoints/Asterix_run_5

rlu_atari_checkpoints/Atlantis_run_1

rlu_atari_checkpoints/Atlantis_run_2

rlu_atari_checkpoints/Atlantis_run_3

rlu_atari_checkpoints/Atlantis_run_4

rlu_atari_checkpoints/Atlantis_run_5

rlu_atari_checkpoints/BankHeist_run_1

rlu_atari_checkpoints/BankHeist_run_2

rlu_atari_checkpoints/BankHeist_run_3

rlu_atari_checkpoints/BankHeist_run_4

rlu_atari_checkpoints/BankHeist_run_5

rlu_atari_checkpoints/BattleZone_run_1

rlu_atari_checkpoints/BattleZone_run_2

rlu_atari_checkpoints/BattleZone_run_3

rlu_atari_checkpoints/BattleZone_run_4

rlu_atari_checkpoints/BattleZone_run_5

rlu_atari_checkpoints/BeamRider_run_1

rlu_atari_checkpoints/BeamRider_run_2

rlu_atari_checkpoints/BeamRider_run_3

rlu_atari_checkpoints/BeamRider_run_4

rlu_atari_checkpoints/BeamRider_run_5

rlu_atari_checkpoints/Boxing_run_1

rlu_atari_checkpoints/Boxing_run_2

rlu_atari_checkpoints/Boxing_run_3

rlu_atari_checkpoints/Boxing_run_4

rlu_atari_checkpoints/Boxing_run_5

rlu_atari_checkpoints/Breakout_run_1

rlu_atari_checkpoints/Breakout_run_2

rlu_atari_checkpoints/Breakout_run_3

rlu_atari_checkpoints/Breakout_run_4

rlu_atari_checkpoints/Breakout_run_5

rlu_atari_checkpoints/Carnival_run_1

rlu_atari_checkpoints/Carnival_run_2

rlu_atari_checkpoints/Carnival_run_3

rlu_atari_checkpoints/Carnival_run_4

rlu_atari_checkpoints/Carnival_run_5

rlu_atari_checkpoints/Centipede_run_1

rlu_atari_checkpoints/Centipede_run_2

rlu_atari_checkpoints/ตะขาบ_run_3

rlu_atari_checkpoints/ตะขาบ_run_4

rlu_atari_checkpoints/ตะขาบ_run_5

rlu_atari_checkpoints/ChopperCommand_run_1

rlu_atari_checkpoints/ChopperCommand_run_2

rlu_atari_checkpoints/ChopperCommand_run_3

rlu_atari_checkpoints/ChopperCommand_run_4

rlu_atari_checkpoints/ChopperCommand_run_5

rlu_atari_checkpoints/CrazyClimber_run_1

rlu_atari_checkpoints/CrazyClimber_run_2

rlu_atari_checkpoints/CrazyClimber_run_3

rlu_atari_checkpoints/CrazyClimber_run_4

rlu_atari_checkpoints/CrazyClimber_run_5

rlu_atari_checkpoints/DemonAttack_run_1

rlu_atari_checkpoints/DemonAttack_run_2

rlu_atari_checkpoints/DemonAttack_run_3

rlu_atari_checkpoints/DemonAttack_run_4

rlu_atari_checkpoints/DemonAttack_run_5

rlu_atari_checkpoints/DoubleDunk_run_1

rlu_atari_checkpoints/DoubleDunk_run_2

rlu_atari_checkpoints/DoubleDunk_run_3

rlu_atari_checkpoints/DoubleDunk_run_4

rlu_atari_checkpoints/DoubleDunk_run_5

rlu_atari_checkpoints/Enduro_run_1

rlu_atari_checkpoints/Enduro_run_2

rlu_atari_checkpoints/Enduro_run_3

rlu_atari_checkpoints/Enduro_run_4

rlu_atari_checkpoints/Enduro_run_5

rlu_atari_checkpoints/FishingDerby_run_1

rlu_atari_checkpoints/FishingDerby_run_2

rlu_atari_checkpoints/FishingDerby_run_3

rlu_atari_checkpoints/FishingDerby_run_4

rlu_atari_checkpoints/FishingDerby_run_5

rlu_atari_checkpoints/ทางด่วน_run_1

rlu_atari_checkpoints/ทางด่วน_run_2

rlu_atari_checkpoints/ทางด่วน_run_3

rlu_atari_checkpoints/ทางด่วน_run_4

rlu_atari_checkpoints/ทางด่วน_run_5

rlu_atari_checkpoints/Frostbite_run_1

rlu_atari_checkpoints/Frostbite_run_2

rlu_atari_checkpoints/Frostbite_run_3

rlu_atari_checkpoints/Frostbite_run_4

rlu_atari_checkpoints/Frostbite_run_5

rlu_atari_checkpoints/Gopher_run_1

rlu_atari_checkpoints/Gopher_run_2

rlu_atari_checkpoints/Gopher_run_3

rlu_atari_checkpoints/Gopher_run_4

rlu_atari_checkpoints/Gopher_run_5

rlu_atari_checkpoints/Gravitar_run_1

rlu_atari_checkpoints/Gravitar_run_2

rlu_atari_checkpoints/Gravitar_run_3

rlu_atari_checkpoints/Gravitar_run_4

rlu_atari_checkpoints/Gravitar_run_5

rlu_atari_checkpoints/Hero_run_1

rlu_atari_checkpoints/Hero_run_2

rlu_atari_checkpoints/Hero_run_3

rlu_atari_checkpoints/Hero_run_4

rlu_atari_checkpoints/Hero_run_5

rlu_atari_checkpoints/IceHockey_run_1

rlu_atari_checkpoints/IceHockey_run_2

rlu_atari_checkpoints/IceHockey_run_3

rlu_atari_checkpoints/IceHockey_run_4

rlu_atari_checkpoints/IceHockey_run_5

rlu_atari_checkpoints/Jamesbond_run_1

rlu_atari_checkpoints/Jamesbond_run_2

rlu_atari_checkpoints/Jamesbond_run_3

rlu_atari_checkpoints/Jamesbond_run_4

rlu_atari_checkpoints/Jamesbond_run_5

rlu_atari_checkpoints/Kangaroo_run_1

rlu_atari_checkpoints/Kangaroo_run_2

rlu_atari_checkpoints/Kangaroo_run_3

rlu_atari_checkpoints/Kangaroo_run_4

rlu_atari_checkpoints/Kangaroo_run_5

rlu_atari_checkpoints/Krull_run_1

rlu_atari_checkpoints/Krull_run_2

rlu_atari_checkpoints/Krull_run_3

rlu_atari_checkpoints/Krull_run_4

rlu_atari_checkpoints/Krull_run_5

rlu_atari_checkpoints/KungFuMaster_run_1

rlu_atari_checkpoints/KungFuMaster_run_2

rlu_atari_checkpoints/KungFuMaster_run_3

rlu_atari_checkpoints/KungFuMaster_run_4

rlu_atari_checkpoints/KungFuMaster_run_5

rlu_atari_checkpoints/MsPacman_run_1

rlu_atari_checkpoints/MsPacman_run_2

rlu_atari_checkpoints/MsPacman_run_3

rlu_atari_checkpoints/MsPacman_run_4

rlu_atari_checkpoints/MsPacman_run_5

rlu_atari_checkpoints/NameThisGame_run_1

rlu_atari_checkpoints/NameThisGame_run_2

rlu_atari_checkpoints/NameThisGame_run_3

rlu_atari_checkpoints/NameThisGame_run_4

rlu_atari_checkpoints/NameThisGame_run_5

rlu_atari_checkpoints/Phoenix_run_1

rlu_atari_checkpoints/Phoenix_run_2

rlu_atari_checkpoints/Phoenix_run_3

rlu_atari_checkpoints/Phoenix_run_4

rlu_atari_checkpoints/Phoenix_run_5

rlu_atari_checkpoints/Pong_run_1

rlu_atari_checkpoints/Pong_run_2

rlu_atari_checkpoints/Pong_run_3

rlu_atari_checkpoints/Pong_run_4

rlu_atari_checkpoints/Pong_run_5

rlu_atari_checkpoints/Pooyan_run_1

rlu_atari_checkpoints/Pooyan_run_2

rlu_atari_checkpoints/Pooyan_run_3

rlu_atari_checkpoints/Pooyan_run_4

rlu_atari_checkpoints/Pooyan_run_5

rlu_atari_checkpoints/Qbert_run_1

rlu_atari_checkpoints/Qbert_run_2

rlu_atari_checkpoints/Qbert_run_3

rlu_atari_checkpoints/Qbert_run_4

rlu_atari_checkpoints/Qbert_run_5

rlu_atari_checkpoints/Riverraid_run_1

rlu_atari_checkpoints/Riverraid_run_2

rlu_atari_checkpoints/Riverraid_run_3

rlu_atari_checkpoints/Riverraid_run_4

rlu_atari_checkpoints/Riverraid_run_5

rlu_atari_checkpoints/RoadRunner_run_1

rlu_atari_checkpoints/RoadRunner_run_2

rlu_atari_checkpoints/RoadRunner_run_3

rlu_atari_checkpoints/RoadRunner_run_4

rlu_atari_checkpoints/RoadRunner_run_5

rlu_atari_checkpoints/Robotank_run_1

rlu_atari_checkpoints/Robotank_run_2

rlu_atari_checkpoints/Robotank_run_3

rlu_atari_checkpoints/Robotank_run_4

rlu_atari_checkpoints/Robotank_run_5

rlu_atari_checkpoints/Seaquest_run_1

rlu_atari_checkpoints/Seaquest_run_2

rlu_atari_checkpoints/Seaquest_run_3

rlu_atari_checkpoints/Seaquest_run_4

rlu_atari_checkpoints/Seaquest_run_5

rlu_atari_checkpoints/SpaceInvaders_run_1

rlu_atari_checkpoints/SpaceInvaders_run_2

rlu_atari_checkpoints/SpaceInvaders_run_3

rlu_atari_checkpoints/SpaceInvaders_run_4

rlu_atari_checkpoints/SpaceInvaders_run_5

rlu_atari_checkpoints/StarGunner_run_1

rlu_atari_checkpoints/StarGunner_run_2

rlu_atari_checkpoints/StarGunner_run_3

rlu_atari_checkpoints/StarGunner_run_4

rlu_atari_checkpoints/StarGunner_run_5

rlu_atari_checkpoints/TimePilot_run_1

rlu_atari_checkpoints/TimePilot_run_2

rlu_atari_checkpoints/TimePilot_run_3

rlu_atari_checkpoints/TimePilot_run_4

rlu_atari_checkpoints/TimePilot_run_5

rlu_atari_checkpoints/UpNDown_run_1

rlu_atari_checkpoints/UpNDown_run_2

rlu_atari_checkpoints/UpNDown_run_3

rlu_atari_checkpoints/UpNDown_run_4

rlu_atari_checkpoints/UpNDown_run_5

rlu_atari_checkpoints/VideoPinball_run_1

rlu_atari_checkpoints/VideoPinball_run_2

rlu_atari_checkpoints/VideoPinball_run_3

rlu_atari_checkpoints/VideoPinball_run_4

rlu_atari_checkpoints/VideoPinball_run_5

rlu_atari_checkpoints/WizardOfWor_run_1

rlu_atari_checkpoints/WizardOfWor_run_2

rlu_atari_checkpoints/WizardOfWor_run_3

rlu_atari_checkpoints/WizardOfWor_run_4

rlu_atari_checkpoints/WizardOfWor_run_5

rlu_atari_checkpoints/YarsRevenge_run_1

rlu_atari_checkpoints/YarsRevenge_run_2

rlu_atari_checkpoints/YarsRevenge_run_3

rlu_atari_checkpoints/YarsRevenge_run_4

rlu_atari_checkpoints/YarsRevenge_run_5

rlu_atari_checkpoints/Zaxxon_run_1

rlu_atari_checkpoints/Zaxxon_run_2

rlu_atari_checkpoints/Zaxxon_run_3

rlu_atari_checkpoints/Zaxxon_run_4

rlu_atari_checkpoints/Zaxxon_run_5