rlu_atari_puntos de control_ordenado

Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

  • Descripción :

RL Unplugged es un conjunto de puntos de referencia para el aprendizaje por refuerzo fuera de línea. El RL Unplugged está diseñado en torno a las siguientes consideraciones: para facilitar el uso, proporcionamos los conjuntos de datos con una API unificada que facilita al profesional trabajar con todos los datos en la suite una vez que se ha establecido una canalización general.

Los conjuntos de datos siguen el formato RLDS para representar pasos y episodios.

Estamos lanzando un conjunto de datos grande y diverso de juego siguiendo el protocolo descrito por Agarwal et al., 2020 , que se puede usar para evaluar varios algoritmos discretos de RL fuera de línea. El conjunto de datos se genera ejecutando un agente DQN en línea y registrando las transiciones desde su reproducción durante el entrenamiento con acciones adhesivas Machado et al., 2018 . Como se indica en Agarwal et al., 2020 , para cada juego usamos datos de cinco carreras con 50 millones de transiciones cada una. Lanzamos conjuntos de datos para 46 juegos de Atari. Para obtener detalles sobre cómo se generó el conjunto de datos, consulte el documento.

Atari es un punto de referencia estándar de RL. Le recomendamos que pruebe los métodos de RL fuera de línea en Atari si está interesado en comparar su enfoque con otros métodos de RL fuera de línea de última generación con acciones discretas.

La recompensa de cada paso es recortada (obtenida con [-1, 1] recorte) y el episodio incluye la suma de la recompensa recortada por episodio.

Cada una de las configuraciones se divide en divisiones. Las divisiones corresponden a puntos de control de 1 millón de pasos (tenga en cuenta que la cantidad de episodios puede diferir). Los puntos de control se ordenan en el tiempo (por lo que el punto de control 0 se ejecutó antes que el punto de control 1).

Los episodios dentro de cada división están ordenados. Consulta https://www.tensorflow.org/datasets/determinism si quieres asegurarte de leer los episodios en orden.

Este conjunto de datos corresponde al utilizado en el documento de repetición de DQN. https://research.google/tools/datasets/dqn-replay/

Separar Ejemplos
  • Estructura de características :
FeaturesDict({
    'checkpoint_id': tf.int64,
    'episode_id': tf.int64,
    'episode_return': Scalar(shape=(), dtype=tf.float32),
    'steps': Dataset({
        'action': tf.int64,
        'discount': tf.float32,
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': Image(shape=(84, 84, 1), dtype=tf.uint8),
        'reward': Scalar(shape=(), dtype=tf.float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción Rango de valores
CaracterísticasDict
id_punto_de_control Tensor tf.int64
episodio_id Tensor tf.int64
episodio_retorno Escalar tf.float32 Suma de las recompensas recortadas.
pasos conjunto de datos
pasos/acción Tensor tf.int64
pasos/descuento Tensor tf.float32
pasos/es_primero Tensor tf.bool
pasos/es_último Tensor tf.bool
pasos/es_terminal Tensor tf.bool
pasos/observación Imagen (84, 84, 1) tf.uint8
pasos/recompensa Escalar tf.float32 Recompensa recortada. [-1, 1]
@misc{gulcehre2020rl,
    title={RL Unplugged: Benchmarks for Offline Reinforcement Learning},
    author={Caglar Gulcehre and Ziyu Wang and Alexander Novikov and Tom Le Paine
        and  Sergio Gómez Colmenarejo and Konrad Zolna and Rishabh Agarwal and
        Josh Merel and Daniel Mankowitz and Cosmin Paduraru and Gabriel
        Dulac-Arnold and Jerry Li and Mohammad Norouzi and Matt Hoffman and
        Ofir Nachum and George Tucker and Nicolas Heess and Nando deFreitas},
    year={2020},
    eprint={2006.13888},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

rlu_atari_checkpoints_ordered/Alien_run_1 (configuración predeterminada)

rlu_atari_checkpoints_ordered/Alien_run_2

rlu_atari_checkpoints_ordered/Alien_run_3

rlu_atari_checkpoints_ordered/Alien_run_4

rlu_atari_checkpoints_ordered/Alien_run_5

rlu_atari_checkpoints_ordered/Amidar_run_1

rlu_atari_checkpoints_ordered/Amidar_run_2

rlu_atari_checkpoints_ordered/Amidar_run_3

rlu_atari_checkpoints_ordered/Amidar_run_4

rlu_atari_checkpoints_ordered/Amidar_run_5

rlu_atari_checkpoints_ordered/Asalto_run_1

rlu_atari_checkpoints_ordered/Asalto_run_2

rlu_atari_checkpoints_ordered/Asalto_run_3

rlu_atari_checkpoints_ordered/Asalto_run_4

rlu_atari_checkpoints_ordered/Asalto_run_5

rlu_atari_checkpoints_ordered/Asterix_run_1

rlu_atari_checkpoints_ordered/Asterix_run_2

rlu_atari_checkpoints_ordered/Asterix_run_3

rlu_atari_checkpoints_ordered/Asterix_run_4

rlu_atari_checkpoints_ordered/Asterix_run_5

rlu_atari_checkpoints_ordered/Atlantis_run_1

rlu_atari_checkpoints_ordered/Atlantis_run_2

rlu_atari_checkpoints_ordered/Atlantis_run_3

rlu_atari_checkpoints_ordered/Atlantis_run_4

rlu_atari_checkpoints_ordered/Atlantis_run_5

rlu_atari_checkpoints_ordered/BankHeist_run_1

rlu_atari_checkpoints_ordered/BankHeist_run_2

rlu_atari_checkpoints_ordered/BankHeist_run_3

rlu_atari_checkpoints_ordered/BankHeist_run_4

rlu_atari_checkpoints_ordered/BankHeist_run_5

rlu_atari_checkpoints_ordered/BattleZone_run_1

rlu_atari_checkpoints_ordered/BattleZone_run_2

rlu_atari_checkpoints_ordered/BattleZone_run_3

rlu_atari_checkpoints_ordered/BattleZone_run_4

rlu_atari_checkpoints_ordered/BattleZone_run_5

rlu_atari_checkpoints_ordered/BeamRider_run_1

rlu_atari_checkpoints_ordered/BeamRider_run_2

rlu_atari_puntos de control_ordenado/BeamRider_run_3

rlu_atari_checkpoints_ordered/BeamRider_run_4

rlu_atari_puntos de control_ordenado/BeamRider_run_5

rlu_atari_checkpoints_ordered/Boxing_run_1

rlu_atari_checkpoints_ordered/Boxing_run_2

rlu_atari_checkpoints_ordered/Boxing_run_3

rlu_atari_checkpoints_ordered/Boxing_run_4

rlu_atari_checkpoints_ordered/Boxing_run_5

rlu_atari_checkpoints_ordered/Breakout_run_1

rlu_atari_checkpoints_ordered/Breakout_run_2

rlu_atari_checkpoints_ordered/Breakout_run_3

rlu_atari_checkpoints_ordered/Breakout_run_4

rlu_atari_checkpoints_ordered/Breakout_run_5

rlu_atari_checkpoints_ordered/Carnival_run_1

rlu_atari_checkpoints_ordered/Carnival_run_2

rlu_atari_checkpoints_ordered/Carnival_run_3

rlu_atari_checkpoints_ordered/Carnival_run_4

rlu_atari_checkpoints_ordered/Carnival_run_5

rlu_atari_checkpoints_ordered/Centipede_run_1

rlu_atari_checkpoints_ordered/Centipede_run_2

rlu_atari_checkpoints_ordered/Centipede_run_3

rlu_atari_checkpoints_ordered/Centipede_run_4

rlu_atari_checkpoints_ordered/Centipede_run_5

rlu_atari_checkpoints_ordered/ChopperCommand_run_1

rlu_atari_checkpoints_ordered/ChopperCommand_run_2

rlu_atari_checkpoints_ordered/ChopperCommand_run_3

rlu_atari_checkpoints_ordered/ChopperCommand_run_4

rlu_atari_checkpoints_ordered/ChopperCommand_run_5

rlu_atari_checkpoints_ordered/CrazyClimber_run_1

rlu_atari_checkpoints_ordered/CrazyClimber_run_2

rlu_atari_checkpoints_ordered/CrazyClimber_run_3

rlu_atari_checkpoints_ordered/CrazyClimber_run_4

rlu_atari_checkpoints_ordered/CrazyClimber_run_5

rlu_atari_checkpoints_ordered/DemonAttack_run_1

rlu_atari_checkpoints_ordered/DemonAttack_run_2

rlu_atari_checkpoints_ordered/DemonAttack_run_3

rlu_atari_checkpoints_ordered/DemonAttack_run_4

rlu_atari_checkpoints_ordered/DemonAttack_run_5

rlu_atari_checkpoints_ordered/DoubleDunk_run_1

rlu_atari_checkpoints_ordered/DoubleDunk_run_2

rlu_atari_checkpoints_ordered/DoubleDunk_run_3

rlu_atari_checkpoints_ordered/DoubleDunk_run_4

rlu_atari_checkpoints_ordered/DoubleDunk_run_5

rlu_atari_checkpoints_ordered/Enduro_run_1

rlu_atari_checkpoints_ordered/Enduro_run_2

rlu_atari_checkpoints_ordered/Enduro_run_3

rlu_atari_checkpoints_ordered/Enduro_run_4

rlu_atari_checkpoints_ordered/Enduro_run_5

rlu_atari_checkpoints_ordered/FishingDerby_run_1

rlu_atari_checkpoints_ordered/FishingDerby_run_2

rlu_atari_checkpoints_ordered/FishingDerby_run_3

rlu_atari_checkpoints_ordered/FishingDerby_run_4

rlu_atari_checkpoints_ordered/FishingDerby_run_5

rlu_atari_checkpoints_ordered/Freeway_run_1

rlu_atari_checkpoints_ordered/Freeway_run_2

rlu_atari_checkpoints_ordered/Freeway_run_3

rlu_atari_checkpoints_ordered/Freeway_run_4

rlu_atari_checkpoints_ordered/Freeway_run_5

rlu_atari_checkpoints_ordered/Frostbite_run_1

rlu_atari_checkpoints_ordered/Frostbite_run_2

rlu_atari_checkpoints_ordered/Frostbite_run_3

rlu_atari_checkpoints_ordered/Frostbite_run_4

rlu_atari_checkpoints_ordered/Frostbite_run_5

rlu_atari_puntos de control_ordenado/Gopher_run_1

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_puntos de control_ordenado/Gopher_run_2

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_puntos de control_ordenado/Gopher_run_3

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_puntos de control_ordenado/Gopher_run_4

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_puntos de control_ordenado/Gopher_run_5

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Gravitar_run_1

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Gravitar_run_2

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Gravitar_run_3

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Gravitar_run_4

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Gravitar_run_5

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Héroe_run_1

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_puntos de control_ordenado/Hero_run_2

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_puntos de control_ordenado/Hero_run_3

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_puntos de control_ordenado/Hero_run_4

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_puntos de control_ordenado/Hero_run_5

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/IceHockey_run_1

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/IceHockey_run_2

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/IceHockey_run_3

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/IceHockey_run_4

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/IceHockey_run_5

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Jamesbond_run_1

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Jamesbond_run_2

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Jamesbond_run_3

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Jamesbond_run_4

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Jamesbond_run_5

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Kangaroo_run_1

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Kangaroo_run_2

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Kangaroo_run_3

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Kangaroo_run_4

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Kangaroo_run_5

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Krull_run_1

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Krull_run_2

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Krull_run_3

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Krull_run_4

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Krull_run_5

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/KungFuMaster_run_1

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/KungFuMaster_run_2

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/KungFuMaster_run_3

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/KungFuMaster_run_4

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/KungFuMaster_run_5

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/MsPacman_run_1

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/MsPacman_run_2

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/MsPacman_run_3

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/MsPacman_run_4

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/MsPacman_run_5

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/NombreEsteJuego_run_1

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/NombreEsteJuego_run_2

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/NombreEsteJuego_run_3

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/NombreEsteJuego_run_4

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/NombreEsteJuego_ejecutar_5

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Phoenix_run_1

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_puntos de control_ordenado/Phoenix_run_2

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_puntos de control_ordenado/Phoenix_run_3

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_puntos de control_ordenado/Phoenix_run_4

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_puntos de control_ordenado/Phoenix_run_5

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Pong_run_1

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_puntos de control_ordenado/Pong_run_2

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_puntos de control_ordenado/Pong_run_3

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_puntos de control_ordenado/Pong_run_4

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_puntos de control_pedido/Pong_run_5

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Pooyan_run_1

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Pooyan_run_2

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Pooyan_run_3

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Pooyan_run_4

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Pooyan_run_5

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Qbert_run_1

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Qbert_run_2

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Qbert_run_3

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Qbert_run_4

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Qbert_run_5

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Riverraid_run_1

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Riverraid_run_2

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Riverraid_run_3

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Riverraid_run_4

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Riverraid_run_5

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/RoadRunner_run_1

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/RoadRunner_run_2

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/RoadRunner_run_3

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/RoadRunner_run_4

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_puntos de control_pedido/RoadRunner_run_5

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Robotank_run_1

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Robotank_run_2

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Robotank_run_3

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Robotank_run_4

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Robotank_run_5

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Seaquest_run_1

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Seaquest_run_2

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Seaquest_run_3

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Seaquest_run_4

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Seaquest_run_5

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/SpaceInvaders_run_1

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/SpaceInvaders_run_2

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/SpaceInvaders_run_3

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/SpaceInvaders_run_4

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/SpaceInvaders_run_5

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/StarGunner_run_1

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/StarGunner_run_2

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/StarGunner_run_3

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/StarGunner_run_4

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_puntos de control_ordenado/StarGunner_run_5

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/TimePilot_run_1

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/TimePilot_run_2

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/TimePilot_run_3

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/TimePilot_run_4

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/TimePilot_run_5

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/UpNDown_run_1

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/UpNDown_run_2

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/UpNDown_run_3

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/UpNDown_run_4

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/UpNDown_run_5

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/VideoPinball_run_1

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/VideoPinball_run_2

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/VideoPinball_run_3

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/VideoPinball_run_4

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/VideoPinball_run_5

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/WizardOfWor_run_1

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/WizardOfWor_run_2

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/WizardOfWor_run_3

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/WizardOfWor_run_4

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/WizardOfWor_run_5

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/YarsRevenge_run_1

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/YarsRevenge_run_2

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/YarsRevenge_run_3

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/YarsRevenge_run_4

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/YarsRevenge_run_5

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Zaxxon_run_1

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Zaxxon_run_2

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Zaxxon_run_3

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Zaxxon_run_4

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.

rlu_atari_checkpoints_ordered/Zaxxon_run_5

  • Ejemplos ( tfds.as_dataframe ): Solo se muestra para las primeras 100 configuraciones.