- คำอธิบาย :
RL Unplugged เป็นชุดของการวัดประสิทธิภาพสำหรับการเรียนรู้การเสริมแรงแบบออฟไลน์ RL Unplugged ได้รับการออกแบบโดยคำนึงถึงข้อควรพิจารณาต่อไปนี้: เพื่อให้ง่ายต่อการใช้งาน เราจัดเตรียมชุดข้อมูลด้วย API แบบรวมศูนย์ ซึ่งทำให้ผู้ปฏิบัติงานทำงานกับข้อมูลทั้งหมดในชุดโปรแกรมได้ง่ายเมื่อสร้างไปป์ไลน์ทั่วไปแล้ว
ชุดข้อมูลเป็นไปตาม รูปแบบ RLDS เพื่อแสดงขั้นตอนและตอน
เรากำลังเปิดตัวชุดข้อมูลการเล่นเกมขนาดใหญ่และหลากหลายตามโปรโตคอลที่อธิบายโดย Agarwal et al., 2020 ซึ่งสามารถใช้ในการประเมินอัลกอริธึม RL ออฟไลน์ที่ไม่ต่อเนื่องหลายชุด ชุดข้อมูลถูกสร้างขึ้นโดยเรียกใช้เอเจนต์ DQN ออนไลน์และบันทึกการเปลี่ยนจากการเล่นซ้ำระหว่างการฝึกด้วยการกระทำที่ติดหนึบ Machado et al., 2018 ตามที่ระบุไว้ใน Agarwal et al., 2020 สำหรับแต่ละเกม เราใช้ข้อมูลจากการวิ่งห้าครั้งโดยแต่ละครั้งมีการเปลี่ยน 50 ล้านครั้ง เราเผยแพร่ชุดข้อมูลสำหรับเกมอาตาริ 46 เกม สำหรับรายละเอียดเกี่ยวกับวิธีการสร้างชุดข้อมูล โปรดดูเอกสาร
Atari เป็นเกณฑ์มาตรฐาน RL เราขอแนะนำให้คุณลองใช้วิธี RL ออฟไลน์บน Atari หากคุณสนใจที่จะเปรียบเทียบวิธีการของคุณกับวิธี RL ออฟไลน์ที่ล้ำสมัยด้วยการดำเนินการที่ไม่ต่อเนื่อง
รางวัลของแต่ละขั้นตอนจะถูกตัดออก (ได้รับด้วยการตัด [-1, 1]) และตอนจะรวมผลรวมของรางวัลที่ถูกตัดต่อตอน
การกำหนดค่าแต่ละรายการจะแบ่งออกเป็นส่วนๆ แยกสอดคล้องกับด่าน 1 ล้านขั้นตอน (โปรดทราบว่าจำนวนตอนอาจแตกต่างกัน) มีการสั่งด่านตรวจให้ตรงเวลา (ดังนั้นด่าน 0 วิ่งก่อนด่าน 1)
มีการเรียงลำดับตอนในแต่ละตอน ตรวจสอบ https://www.tensorflow.org/datasets/determinism หากคุณต้องการให้แน่ใจว่าคุณอ่านตอนต่างๆ ตามลำดับ
ชุดข้อมูลนี้สอดคล้องกับชุดข้อมูลที่ใช้ในกระดาษเล่นซ้ำของ DQN https://research.google/tools/datasets/dqn-replay/
หน้าแรก : https://github.com/deepmind/deepmind-research/tree/master/rl_unplugged
ซอร์สโค้ด :
tfds.rl_unplugged.rlu_atari_checkpoints_ordered.RluAtariCheckpointsOrdered
รุ่น :
-
1.0.0
: การเปิดตัวครั้งแรก -
1.1.0
(ค่าเริ่มต้น): ลบฟิลด์รางวัลที่ถูกตัดซ้ำซ้อน
-
ขนาดดาวน์โหลด :
Unknown size
ขนาดชุดข้อมูล :
Unknown size
แคชอัตโนมัติ ( เอกสาร ): Unknown
แยก :
แยก | ตัวอย่าง |
---|
- โครงสร้างคุณสมบัติ :
FeaturesDict({
'checkpoint_id': tf.int64,
'episode_id': tf.int64,
'episode_return': Scalar(shape=(), dtype=tf.float32),
'steps': Dataset({
'action': tf.int64,
'discount': tf.float32,
'is_first': tf.bool,
'is_last': tf.bool,
'is_terminal': tf.bool,
'observation': Image(shape=(84, 84, 1), dtype=tf.uint8),
'reward': Scalar(shape=(), dtype=tf.float32),
}),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dtype | คำอธิบาย | ช่วงค่า |
---|---|---|---|---|---|
คุณสมบัติDict | |||||
checkpoint_id | เทนเซอร์ | tf.int64 | |||
ตอน_id | เทนเซอร์ | tf.int64 | |||
ตอน_return | สเกลาร์ | tf.float32 | ผลรวมของรางวัลที่ตัดมา | ||
ขั้นตอน | ชุดข้อมูล | ||||
ขั้นตอน/การกระทำ | เทนเซอร์ | tf.int64 | |||
ขั้นตอน/ส่วนลด | เทนเซอร์ | tf.float32 | |||
ขั้นตอน/is_first | เทนเซอร์ | tf.bool | |||
ขั้นตอน/is_last | เทนเซอร์ | tf.bool | |||
ขั้นตอน/is_terminal | เทนเซอร์ | tf.bool | |||
ขั้นตอน/การสังเกต | ภาพ | (84, 84, 1) | tf.uint8 | ||
ขั้นตอน/รางวัล | สเกลาร์ | tf.float32 | ตัดรางวัล. | [-1, 1] |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):None
รูป ( tfds.show_examples ): ไม่รองรับ
อ้างอิง :
@misc{gulcehre2020rl,
title={RL Unplugged: Benchmarks for Offline Reinforcement Learning},
author={Caglar Gulcehre and Ziyu Wang and Alexander Novikov and Tom Le Paine
and Sergio Gómez Colmenarejo and Konrad Zolna and Rishabh Agarwal and
Josh Merel and Daniel Mankowitz and Cosmin Paduraru and Gabriel
Dulac-Arnold and Jerry Li and Mohammad Norouzi and Matt Hoffman and
Ofir Nachum and George Tucker and Nicolas Heess and Nando deFreitas},
year={2020},
eprint={2006.13888},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
rlu_atari_checkpoints_ordered/Alien_run_1 (การกำหนดค่าเริ่มต้น)
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Alien_run_2
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Alien_run_3
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Alien_run_4
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Alien_run_5
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Amidar_run_1
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Amidar_run_2
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Amidar_run_3
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Amidar_run_4
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Amidar_run_5
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Assault_run_1
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Assault_run_2
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Assault_run_3
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Assault_run_4
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Assault_run_5
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Asterix_run_1
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Asterix_run_2
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Asterix_run_3
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Asterix_run_4
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Asterix_run_5
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Atlantis_run_1
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Atlantis_run_2
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Atlantis_run_3
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Atlantis_run_4
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Atlantis_run_5
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BankHeist_run_1
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BankHeist_run_2
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BankHeist_run_3
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BankHeist_run_4
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BankHeist_run_5
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BattleZone_run_1
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BattleZone_run_2
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BattleZone_run_3
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BattleZone_run_4
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BattleZone_run_5
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BeamRider_run_1
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BeamRider_run_2
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BeamRider_run_3
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BeamRider_run_4
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BeamRider_run_5
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Boxing_run_1
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Boxing_run_2
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Boxing_run_3
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Boxing_run_4
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Boxing_run_5
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Breakout_run_1
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Breakout_run_2
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Breakout_run_3
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Breakout_run_4
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Breakout_run_5
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Carnival_run_1
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Carnival_run_2
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Carnival_run_3
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Carnival_run_4
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Carnival_run_5
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Centipede_run_1
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Centipede_run_2
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/ตะขาบ_run_3
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Centipede_run_4
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Centipede_run_5
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/ChopperCommand_run_1
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/ChopperCommand_run_2
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/ChopperCommand_run_3
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/ChopperCommand_run_4
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/ChopperCommand_run_5
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/CrazyClimber_run_1
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/CrazyClimber_run_2
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/CrazyClimber_run_3
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/CrazyClimber_run_4
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/CrazyClimber_run_5
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/DemonAttack_run_1
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/DemonAttack_run_2
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/DemonAttack_run_3
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/DemonAttack_run_4
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/DemonAttack_run_5
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/DoubleDunk_run_1
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/DoubleDunk_run_2
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/DoubleDunk_run_3
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/DoubleDunk_run_4
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/DoubleDunk_run_5
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Enduro_run_1
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Enduro_run_2
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Enduro_run_3
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Enduro_run_4
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Enduro_run_5
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/FishingDerby_run_1
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/FishingDerby_run_2
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/FishingDerby_run_3
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/FishingDerby_run_4
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/FishingDerby_run_5
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/ทางด่วน_run_1
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/ทางด่วน_run_2
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/ทางด่วน_run_3
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/ทางด่วน_run_4
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/ทางด่วน_run_5
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Frostbite_run_1
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Frostbite_run_2
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Frostbite_run_3
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Frostbite_run_4
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Frostbite_run_5
- ตัวอย่าง ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Gopher_run_1
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Gopher_run_2
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Gopher_run_3
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Gopher_run_4
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Gopher_run_5
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Gravitar_run_1
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Gravitar_run_2
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Gravitar_run_3
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Gravitar_run_4
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Gravitar_run_5
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Hero_run_1
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Hero_run_2
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Hero_run_3
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Hero_run_4
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Hero_run_5
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/IceHockey_run_1
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/IceHockey_run_2
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/IceHockey_run_3
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/IceHockey_run_4
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/IceHockey_run_5
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Jamesbond_run_1
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Jamesbond_run_2
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Jamesbond_run_3
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Jamesbond_run_4
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Jamesbond_run_5
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Kangaroo_run_1
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Kangaroo_run_2
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Kangaroo_run_3
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Kangaroo_run_4
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Kangaroo_run_5
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Krull_run_1
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Krull_run_2
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Krull_run_3
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Krull_run_4
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Krull_run_5
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/KungFuMaster_run_1
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/KungFuMaster_run_2
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/KungFuMaster_run_3
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/KungFuMaster_run_4
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/KungFuMaster_run_5
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/MsPacman_run_1
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/MsPacman_run_2
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/MsPacman_run_3
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/MsPacman_run_4
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/MsPacman_run_5
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/NameThisGame_run_1
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/NameThisGame_run_2
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/NameThisGame_run_3
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/NameThisGame_run_4
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/NameThisGame_run_5
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Phoenix_run_1
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Phoenix_run_2
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Phoenix_run_3
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Phoenix_run_4
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Phoenix_run_5
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Pong_run_1
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Pong_run_2
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Pong_run_3
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Pong_run_4
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Pong_run_5
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Pooyan_run_1
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Pooyan_run_2
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Pooyan_run_3
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Pooyan_run_4
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Pooyan_run_5
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Qbert_run_1
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Qbert_run_2
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Qbert_run_3
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Qbert_run_4
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Qbert_run_5
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Riverraid_run_1
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Riverraid_run_2
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Riverraid_run_3
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Riverraid_run_4
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Riverraid_run_5
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/RoadRunner_run_1
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/RoadRunner_run_2
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/RoadRunner_run_3
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/RoadRunner_run_4
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/RoadRunner_run_5
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Robotank_run_1
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Robotank_run_2
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Robotank_run_3
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Robotank_run_4
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Robotank_run_5
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Seaquest_run_1
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Seaquest_run_2
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Seaquest_run_3
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Seaquest_run_4
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Seaquest_run_5
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/SpaceInvaders_run_1
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/SpaceInvaders_run_2
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/SpaceInvaders_run_3
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/SpaceInvaders_run_4
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/SpaceInvaders_run_5
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/StarGunner_run_1
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/StarGunner_run_2
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/StarGunner_run_3
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/StarGunner_run_4
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/StarGunner_run_5
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/TimePilot_run_1
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/TimePilot_run_2
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/TimePilot_run_3
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/TimePilot_run_4
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/TimePilot_run_5
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/UpNDown_run_1
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/UpNDown_run_2
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/UpNDown_run_3
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/UpNDown_run_4
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/UpNDown_run_5
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/VideoPinball_run_1
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/VideoPinball_run_2
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/VideoPinball_run_3
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/VideoPinball_run_4
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/VideoPinball_run_5
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/WizardOfWor_run_1
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/WizardOfWor_run_2
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/WizardOfWor_run_3
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/WizardOfWor_run_4
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/WizardOfWor_run_5
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/YarsRevenge_run_1
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/YarsRevenge_run_2
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/YarsRevenge_run_3
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/YarsRevenge_run_4
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/YarsRevenge_run_5
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Zaxxon_run_1
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Zaxxon_run_2
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Zaxxon_run_3
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Zaxxon_run_4
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น
rlu_atari_checkpoints_ordered/Zaxxon_run_5
- ตัวอย่าง ( tfds.as_dataframe ): แสดงเฉพาะการกำหนดค่า 100 รายการแรกเท่านั้น