- Описание :
RL Unplugged — это набор тестов для автономного обучения с подкреплением. RL Unplugged разработан с учетом следующих соображений: чтобы упростить использование, мы предоставляем наборы данных с унифицированным API, который позволяет практикующим специалистам легко работать со всеми данными в наборе после того, как общий конвейер был установлен.
Наборы данных соответствуют формату RLDS для представления шагов и эпизодов.
Мы выпускаем большой и разнообразный набор данных игрового процесса в соответствии с протоколом, описанным Agarwal et al., 2020 , который можно использовать для оценки нескольких дискретных автономных алгоритмов RL. Набор данных генерируется путем запуска онлайн-агента DQN и записи переходов из его воспроизведения во время обучения с помощью липких действий Machado et al., 2018 . Как указано в Agarwal et al., 2020 , для каждой игры мы используем данные пяти запусков с 50 миллионами переходов в каждом. Мы выпускаем наборы данных для 46 игр Atari. Подробнее о том, как был сгенерирован набор данных, см. в документе.
Atari — это стандартный тест RL. Мы рекомендуем вам попробовать офлайн-методы RL на Atari, если вы хотите сравнить свой подход с другими современными офлайн-методами RL с дискретными действиями.
Награда за каждый шаг усекается (получается с отсечением [-1, 1]), и эпизод включает в себя сумму усеченного вознаграждения за эпизод.
Каждая из конфигураций разбита на сплиты. Разделения соответствуют контрольным точкам в 1 млн шагов (обратите внимание, что количество эпизодов может отличаться). Контрольные точки упорядочены по времени (поэтому контрольная точка 0 выполнялась раньше контрольной точки 1).
Эпизоды внутри каждого сплита упорядочены. Проверьте https://www.tensorflow.org/datasets/determinism , если хотите убедиться, что вы читаете эпизоды по порядку.
Этот набор данных соответствует тому, который использовался в документе воспроизведения DQN. https://research.google/tools/datasets/dqn-replay/
Домашняя страница : https://github.com/deepmind/deepmind-research/tree/master/rl_unplugged
Исходный код :
tfds.rl_unplugged.rlu_atari_checkpoints_ordered.RluAtariCheckpointsOrdered
Версии :
-
1.0.0
: Первоначальный выпуск. -
1.1.0
(по умолчанию): удалены лишние обрезанные поля вознаграждения.
-
Размер загрузки :
Unknown size
Размер набора данных :
Unknown size
Автокэширование ( документация ): неизвестно
Сплиты :
Расколоть | Примеры |
---|
- Структура функции :
FeaturesDict({
'checkpoint_id': tf.int64,
'episode_id': tf.int64,
'episode_return': Scalar(shape=(), dtype=tf.float32),
'steps': Dataset({
'action': tf.int64,
'discount': tf.float32,
'is_first': tf.bool,
'is_last': tf.bool,
'is_terminal': tf.bool,
'observation': Image(shape=(84, 84, 1), dtype=tf.uint8),
'reward': Scalar(shape=(), dtype=tf.float32),
}),
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание | Диапазон значений |
---|---|---|---|---|---|
ОсобенностиDict | |||||
checkpoint_id | Тензор | tf.int64 | |||
id_эпизода | Тензор | tf.int64 | |||
эпизод_возврат | Скаляр | tf.float32 | Сумма урезанных наград. | ||
шаги | Набор данных | ||||
шаги/действие | Тензор | tf.int64 | |||
шаги/скидка | Тензор | tf.float32 | |||
шаги / is_first | Тензор | tf.bool | |||
шаги/is_last | Тензор | tf.bool | |||
шаги/is_terminal | Тензор | tf.bool | |||
шаги/наблюдение | Изображение | (84, 84, 1) | tf.uint8 | ||
шаги/награда | Скаляр | tf.float32 | Урезанная награда. | [-1, 1] |
Ключи под наблюдением (см . документ
as_supervised
):None
Рисунок ( tfds.show_examples ): не поддерживается.
Цитата :
@misc{gulcehre2020rl,
title={RL Unplugged: Benchmarks for Offline Reinforcement Learning},
author={Caglar Gulcehre and Ziyu Wang and Alexander Novikov and Tom Le Paine
and Sergio Gómez Colmenarejo and Konrad Zolna and Rishabh Agarwal and
Josh Merel and Daniel Mankowitz and Cosmin Paduraru and Gabriel
Dulac-Arnold and Jerry Li and Mohammad Norouzi and Matt Hoffman and
Ofir Nachum and George Tucker and Nicolas Heess and Nando deFreitas},
year={2020},
eprint={2006.13888},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
rlu_atari_checkpoints_ordered/Alien_run_1 (конфигурация по умолчанию)
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Alien_run_2
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Alien_run_3
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Alien_run_4
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Alien_run_5
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Amidar_run_1
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Amidar_run_2
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Amidar_run_3
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Amidar_run_4
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Amidar_run_5
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Assault_run_1
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Assault_run_2
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Assault_run_3
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Assault_run_4
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Assault_run_5
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Asterix_run_1
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Asterix_run_2
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Asterix_run_3
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Asterix_run_4
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Asterix_run_5
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Atlantis_run_1
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Atlantis_run_2
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Atlantis_run_3
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Atlantis_run_4
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Atlantis_run_5
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BankHeist_run_1
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BankHeist_run_2
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BankHeist_run_3
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BankHeist_run_4
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BankHeist_run_5
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BattleZone_run_1
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BattleZone_run_2
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BattleZone_run_3
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BattleZone_run_4
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BattleZone_run_5
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BeamRider_run_1
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BeamRider_run_2
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BeamRider_run_3
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BeamRider_run_4
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/BeamRider_run_5
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Boxing_run_1
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Boxing_run_2
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Boxing_run_3
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Boxing_run_4
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Boxing_run_5
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Breakout_run_1
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Breakout_run_2
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Breakout_run_3
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Breakout_run_4
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Breakout_run_5
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Carnival_run_1
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Carnival_run_2
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Carnival_run_3
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Carnival_run_4
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Carnival_run_5
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Сороконожка_run_1
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Сороконожка_run_2
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Сороконожка_run_3
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Сороконожка_run_4
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Сороконожка_run_5
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/ChopperCommand_run_1
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/ChopperCommand_run_2
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/ChopperCommand_run_3
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/ChopperCommand_run_4
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/ChopperCommand_run_5
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/CrazyClimber_run_1
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/CrazyClimber_run_2
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/CrazyClimber_run_3
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/CrazyClimber_run_4
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/CrazyClimber_run_5
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/DemonAttack_run_1
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/DemonAttack_run_2
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/DemonAttack_run_3
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/DemonAttack_run_4
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/DemonAttack_run_5
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/DoubleDunk_run_1
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/DoubleDunk_run_2
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/DoubleDunk_run_3
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/DoubleDunk_run_4
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/DoubleDunk_run_5
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Enduro_run_1
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Enduro_run_2
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Enduro_run_3
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Enduro_run_4
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Enduro_run_5
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/FishingDerby_run_1
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/FishingDerby_run_2
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/FishingDerby_run_3
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/FishingDerby_run_4
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/FishingDerby_run_5
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Freeway_run_1
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Freeway_run_2
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Freeway_run_3
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Freeway_run_4
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Freeway_run_5
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Frostbite_run_1
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Frostbite_run_2
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Frostbite_run_3
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Frostbite_run_4
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Frostbite_run_5
- Примеры ( tfds.as_dataframe ):
rlu_atari_checkpoints_ordered/Суслик_run_1
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Суслик_run_2
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Суслик_run_3
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Суслик_run_4
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Суслик_run_5
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Gravitar_run_1
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Gravitar_run_2
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Gravitar_run_3
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Gravitar_run_4
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Gravitar_run_5
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Hero_run_1
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Hero_run_2
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Hero_run_3
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Hero_run_4
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Hero_run_5
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/IceHockey_run_1
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/IceHockey_run_2
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/IceHockey_run_3
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/IceHockey_run_4
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/IceHockey_run_5
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Jamesbond_run_1
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Jamesbond_run_2
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Jamesbond_run_3
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Jamesbond_run_4
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Jamesbond_run_5
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/кенгуру_run_1
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/кенгуру_run_2
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/кенгуру_run_3
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/кенгуру_run_4
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/кенгуру_run_5
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Krull_run_1
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Krull_run_2
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Krull_run_3
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Krull_run_4
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Krull_run_5
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/KungFuMaster_run_1
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/KungFuMaster_run_2
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/KungFuMaster_run_3
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/KungFuMaster_run_4
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/KungFuMaster_run_5
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/MsPacman_run_1
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/MsPacman_run_2
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/MsPacman_run_3
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/MsPacman_run_4
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/MsPacman_run_5
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/NameThisGame_run_1
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/NameThisGame_run_2
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/NameThisGame_run_3
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/NameThisGame_run_4
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/NameThisGame_run_5
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Phoenix_run_1
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Phoenix_run_2
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Phoenix_run_3
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Phoenix_run_4
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Phoenix_run_5
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Pong_run_1
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Pong_run_2
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Pong_run_3
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Pong_run_4
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Pong_run_5
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Pooyan_run_1
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Pooyan_run_2
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Pooyan_run_3
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Pooyan_run_4
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Pooyan_run_5
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Qbert_run_1
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Qbert_run_2
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Qbert_run_3
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Qbert_run_4
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Qbert_run_5
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Riverraid_run_1
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Riverraid_run_2
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Riverraid_run_3
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Riverraid_run_4
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Riverraid_run_5
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/RoadRunner_run_1
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/RoadRunner_run_2
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/RoadRunner_run_3
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/RoadRunner_run_4
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/RoadRunner_run_5
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Robotank_run_1
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Robotank_run_2
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Robotank_run_3
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Robotank_run_4
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Robotank_run_5
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Seaquest_run_1
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Seaquest_run_2
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Seaquest_run_3
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Seaquest_run_4
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Seaquest_run_5
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/SpaceInvaders_run_1
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/SpaceInvaders_run_2
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/SpaceInvaders_run_3
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/SpaceInvaders_run_4
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/SpaceInvaders_run_5
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/StarGunner_run_1
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/StarGunner_run_2
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/StarGunner_run_3
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/StarGunner_run_4
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/StarGunner_run_5
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/TimePilot_run_1
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/TimePilot_run_2
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/TimePilot_run_3
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/TimePilot_run_4
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/TimePilot_run_5
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/UpNdown_run_1
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/UpNdown_run_2
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/UpNdown_run_3
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/UpNDown_run_4
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/UpNdown_run_5
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/VideoPinball_run_1
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/VideoPinball_run_2
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/VideoPinball_run_3
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/VideoPinball_run_4
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/VideoPinball_run_5
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/WizardOfWor_run_1
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/WizardOfWor_run_2
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/WizardOfWor_run_3
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/WizardOfWor_run_4
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/WizardOfWor_run_5
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/YarsRevenge_run_1
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/YarsRevenge_run_2
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/YarsRevenge_run_3
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/YarsRevenge_run_4
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/YarsRevenge_run_5
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Zaxxon_run_1
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Zaxxon_run_2
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Zaxxon_run_3
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Zaxxon_run_4
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
rlu_atari_checkpoints_ordered/Zaxxon_run_5
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.