rlu_rwrl

  • Descripción :

RL Unplugged es un conjunto de puntos de referencia para el aprendizaje por refuerzo fuera de línea. El RL Unplugged está diseñado en torno a las siguientes consideraciones: para facilitar el uso, proporcionamos los conjuntos de datos con una API unificada que facilita al profesional trabajar con todos los datos en la suite una vez que se ha establecido una canalización general.

Los conjuntos de datos siguen el formato RLDS para representar pasos y episodios.

Los ejemplos en el conjunto de datos representan las transiciones de SAR almacenadas cuando se ejecuta un agente capacitado parcialmente en línea como se describe en https://arxiv.org/abs/1904.12901 Seguimos el formato del conjunto de datos RLDS, como se especifica en https://github.com/google-research /rlds#formato-de-conjunto-de-datos

Lanzamos 40 conjuntos de datos en 8 tareas en total, sin desafío combinado y desafío combinado fácil en las tareas de carro, caminante, cuadrúpedo y humanoide. Cada tarea contiene 5 tamaños diferentes de conjuntos de datos, 1%, 5%, 20%, 40% y 100%. Tenga en cuenta que no se garantiza que el conjunto de datos más pequeño sea un subconjunto de los más grandes. Para obtener detalles sobre cómo se generó el conjunto de datos, consulte el documento.

@misc{gulcehre2020rl,
    title={RL Unplugged: Benchmarks for Offline Reinforcement Learning},
    author={Caglar Gulcehre and Ziyu Wang and Alexander Novikov and Tom Le Paine
        and  Sergio Gómez Colmenarejo and Konrad Zolna and Rishabh Agarwal and
        Josh Merel and Daniel Mankowitz and Cosmin Paduraru and Gabriel
        Dulac-Arnold and Jerry Li and Mohammad Norouzi and Matt Hoffman and
        Ofir Nachum and George Tucker and Nicolas Heess and Nando deFreitas},
    year={2020},
    eprint={2006.13888},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

rlu_rwrl/cartpole_swingup_combined_challenge_none_1_percent (configuración predeterminada)

  • Tamaño del conjunto de datos : 172.43 KiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 5
  • Estructura de características :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(2,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor tf.float32
pasos conjunto de datos
pasos/acción Tensor (1,) tf.float32
pasos/descuento Tensor (1,) tf.float32
pasos/es_primero Tensor tf.bool
pasos/es_último Tensor tf.bool
pasos/es_terminal Tensor tf.bool
pasos/observación CaracterísticasDict
pasos/observación/posición Tensor (3,) tf.float32
pasos/observación/velocidad Tensor (2,) tf.float32
pasos/recompensa Tensor (1,) tf.float32

rlu_rwrl/cartpole_swingup_combined_challenge_none_5_percent

  • Tamaño del conjunto de datos : 862.13 KiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 25
  • Estructura de características :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(2,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor tf.float32
pasos conjunto de datos
pasos/acción Tensor (1,) tf.float32
pasos/descuento Tensor (1,) tf.float32
pasos/es_primero Tensor tf.bool
pasos/es_último Tensor tf.bool
pasos/es_terminal Tensor tf.bool
pasos/observación CaracterísticasDict
pasos/observación/posición Tensor (3,) tf.float32
pasos/observación/velocidad Tensor (2,) tf.float32
pasos/recompensa Tensor (1,) tf.float32

rlu_rwrl/cartpole_swingup_combined_challenge_none_20_percent

  • Tamaño del conjunto de datos : 3.37 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 100
  • Estructura de características :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(2,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor tf.float32
pasos conjunto de datos
pasos/acción Tensor (1,) tf.float32
pasos/descuento Tensor (1,) tf.float32
pasos/es_primero Tensor tf.bool
pasos/es_último Tensor tf.bool
pasos/es_terminal Tensor tf.bool
pasos/observación CaracterísticasDict
pasos/observación/posición Tensor (3,) tf.float32
pasos/observación/velocidad Tensor (2,) tf.float32
pasos/recompensa Tensor (1,) tf.float32

rlu_rwrl/cartpole_swingup_combined_challenge_none_40_percent

  • Tamaño del conjunto de datos : 6.74 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 200
  • Estructura de características :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(2,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor tf.float32
pasos conjunto de datos
pasos/acción Tensor (1,) tf.float32
pasos/descuento Tensor (1,) tf.float32
pasos/es_primero Tensor tf.bool
pasos/es_último Tensor tf.bool
pasos/es_terminal Tensor tf.bool
pasos/observación CaracterísticasDict
pasos/observación/posición Tensor (3,) tf.float32
pasos/observación/velocidad Tensor (2,) tf.float32
pasos/recompensa Tensor (1,) tf.float32

rlu_rwrl/cartpole_swingup_combined_challenge_none_100_percent

  • Tamaño del conjunto de datos : 16.84 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 500
  • Estructura de características :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(2,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor tf.float32
pasos conjunto de datos
pasos/acción Tensor (1,) tf.float32
pasos/descuento Tensor (1,) tf.float32
pasos/es_primero Tensor tf.bool
pasos/es_último Tensor tf.bool
pasos/es_terminal Tensor tf.bool
pasos/observación CaracterísticasDict
pasos/observación/posición Tensor (3,) tf.float32
pasos/observación/velocidad Tensor (2,) tf.float32
pasos/recompensa Tensor (1,) tf.float32

rlu_rwrl/quadruped_walk_combined_challenge_none_1_percent

  • Tamaño del conjunto de datos : 1.77 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 5
  • Estructura de características :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=tf.float32),
            'force_torque': Tensor(shape=(24,), dtype=tf.float32),
            'imu': Tensor(shape=(6,), dtype=tf.float32),
            'torso_upright': Tensor(shape=(1,), dtype=tf.float32),
            'torso_velocity': Tensor(shape=(3,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor tf.float32
pasos conjunto de datos
pasos/acción Tensor (12,) tf.float32
pasos/descuento Tensor (1,) tf.float32
pasos/es_primero Tensor tf.bool
pasos/es_último Tensor tf.bool
pasos/es_terminal Tensor tf.bool
pasos/observación CaracterísticasDict
pasos/observación/estado_egocéntrico Tensor (44,) tf.float32
pasos/observación/force_torque Tensor (24,) tf.float32
pasos/observación/imu Tensor (6,) tf.float32
pasos/observación/torso_vertical Tensor (1,) tf.float32
pasos/observación/torso_velocidad Tensor (3,) tf.float32
pasos/recompensa Tensor (1,) tf.float32

rlu_rwrl/quadruped_walk_combined_challenge_none_5_percent

  • Tamaño del conjunto de datos : 8.86 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 25
  • Estructura de características :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=tf.float32),
            'force_torque': Tensor(shape=(24,), dtype=tf.float32),
            'imu': Tensor(shape=(6,), dtype=tf.float32),
            'torso_upright': Tensor(shape=(1,), dtype=tf.float32),
            'torso_velocity': Tensor(shape=(3,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor tf.float32
pasos conjunto de datos
pasos/acción Tensor (12,) tf.float32
pasos/descuento Tensor (1,) tf.float32
pasos/es_primero Tensor tf.bool
pasos/es_último Tensor tf.bool
pasos/es_terminal Tensor tf.bool
pasos/observación CaracterísticasDict
pasos/observación/estado_egocéntrico Tensor (44,) tf.float32
pasos/observación/force_torque Tensor (24,) tf.float32
pasos/observación/imu Tensor (6,) tf.float32
pasos/observación/torso_vertical Tensor (1,) tf.float32
pasos/observación/torso_velocidad Tensor (3,) tf.float32
pasos/recompensa Tensor (1,) tf.float32

rlu_rwrl/quadruped_walk_combined_challenge_none_20_percent

  • Tamaño del conjunto de datos : 35.46 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 100
  • Estructura de características :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=tf.float32),
            'force_torque': Tensor(shape=(24,), dtype=tf.float32),
            'imu': Tensor(shape=(6,), dtype=tf.float32),
            'torso_upright': Tensor(shape=(1,), dtype=tf.float32),
            'torso_velocity': Tensor(shape=(3,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor tf.float32
pasos conjunto de datos
pasos/acción Tensor (12,) tf.float32
pasos/descuento Tensor (1,) tf.float32
pasos/es_primero Tensor tf.bool
pasos/es_último Tensor tf.bool
pasos/es_terminal Tensor tf.bool
pasos/observación CaracterísticasDict
pasos/observación/estado_egocéntrico Tensor (44,) tf.float32
pasos/observación/force_torque Tensor (24,) tf.float32
pasos/observación/imu Tensor (6,) tf.float32
pasos/observación/torso_vertical Tensor (1,) tf.float32
pasos/observación/torso_velocidad Tensor (3,) tf.float32
pasos/recompensa Tensor (1,) tf.float32

rlu_rwrl/quadruped_walk_combined_challenge_none_40_percent

  • Tamaño del conjunto de datos : 70.92 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 200
  • Estructura de características :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=tf.float32),
            'force_torque': Tensor(shape=(24,), dtype=tf.float32),
            'imu': Tensor(shape=(6,), dtype=tf.float32),
            'torso_upright': Tensor(shape=(1,), dtype=tf.float32),
            'torso_velocity': Tensor(shape=(3,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor tf.float32
pasos conjunto de datos
pasos/acción Tensor (12,) tf.float32
pasos/descuento Tensor (1,) tf.float32
pasos/es_primero Tensor tf.bool
pasos/es_último Tensor tf.bool
pasos/es_terminal Tensor tf.bool
pasos/observación CaracterísticasDict
pasos/observación/estado_egocéntrico Tensor (44,) tf.float32
pasos/observación/force_torque Tensor (24,) tf.float32
pasos/observación/imu Tensor (6,) tf.float32
pasos/observación/torso_vertical Tensor (1,) tf.float32
pasos/observación/torso_velocidad Tensor (3,) tf.float32
pasos/recompensa Tensor (1,) tf.float32

rlu_rwrl/quadruped_walk_combined_challenge_none_100_percent

  • Tamaño del conjunto de datos : 177.29 MiB

  • Auto-caché ( documentación ): Solo cuando shuffle_files=False (tren)

  • Divisiones :

Separar Ejemplos
'train' 500
  • Estructura de características :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=tf.float32),
            'force_torque': Tensor(shape=(24,), dtype=tf.float32),
            'imu': Tensor(shape=(6,), dtype=tf.float32),
            'torso_upright': Tensor(shape=(1,), dtype=tf.float32),
            'torso_velocity': Tensor(shape=(3,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor tf.float32
pasos conjunto de datos
pasos/acción Tensor (12,) tf.float32
pasos/descuento Tensor (1,) tf.float32
pasos/es_primero Tensor tf.bool
pasos/es_último Tensor tf.bool
pasos/es_terminal Tensor tf.bool
pasos/observación CaracterísticasDict
pasos/observación/estado_egocéntrico Tensor (44,) tf.float32
pasos/observación/force_torque Tensor (24,) tf.float32
pasos/observación/imu Tensor (6,) tf.float32
pasos/observación/torso_vertical Tensor (1,) tf.float32
pasos/observación/torso_velocidad Tensor (3,) tf.float32
pasos/recompensa Tensor (1,) tf.float32

rlu_rwrl/walker_walk_combined_challenge_none_1_percent

  • Tamaño del conjunto de datos : 6.27 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 50
  • Estructura de características :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=tf.float32),
            'orientations': Tensor(shape=(14,), dtype=tf.float32),
            'velocity': Tensor(shape=(9,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor tf.float32
pasos conjunto de datos
pasos/acción Tensor (6,) tf.float32
pasos/descuento Tensor (1,) tf.float32
pasos/es_primero Tensor tf.bool
pasos/es_último Tensor tf.bool
pasos/es_terminal Tensor tf.bool
pasos/observación CaracterísticasDict
pasos/observación/altura Tensor (1,) tf.float32
pasos/observación/orientaciones Tensor (14,) tf.float32
pasos/observación/velocidad Tensor (9,) tf.float32
pasos/recompensa Tensor (1,) tf.float32

rlu_rwrl/walker_walk_combined_challenge_none_5_percent

  • Tamaño del conjunto de datos : 31.34 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 250
  • Estructura de características :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=tf.float32),
            'orientations': Tensor(shape=(14,), dtype=tf.float32),
            'velocity': Tensor(shape=(9,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor tf.float32
pasos conjunto de datos
pasos/acción Tensor (6,) tf.float32
pasos/descuento Tensor (1,) tf.float32
pasos/es_primero Tensor tf.bool
pasos/es_último Tensor tf.bool
pasos/es_terminal Tensor tf.bool
pasos/observación CaracterísticasDict
pasos/observación/altura Tensor (1,) tf.float32
pasos/observación/orientaciones Tensor (14,) tf.float32
pasos/observación/velocidad Tensor (9,) tf.float32
pasos/recompensa Tensor (1,) tf.float32

rlu_rwrl/walker_walk_combined_challenge_none_20_percent

  • Tamaño del conjunto de datos : 125.37 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 1,000
  • Estructura de características :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=tf.float32),
            'orientations': Tensor(shape=(14,), dtype=tf.float32),
            'velocity': Tensor(shape=(9,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor tf.float32
pasos conjunto de datos
pasos/acción Tensor (6,) tf.float32
pasos/descuento Tensor (1,) tf.float32
pasos/es_primero Tensor tf.bool
pasos/es_último Tensor tf.bool
pasos/es_terminal Tensor tf.bool
pasos/observación CaracterísticasDict
pasos/observación/altura Tensor (1,) tf.float32
pasos/observación/orientaciones Tensor (14,) tf.float32
pasos/observación/velocidad Tensor (9,) tf.float32
pasos/recompensa Tensor (1,) tf.float32

rlu_rwrl/walker_walk_combined_challenge_none_40_percent

  • Tamaño del conjunto de datos : 250.75 MiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 2,000
  • Estructura de características :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=tf.float32),
            'orientations': Tensor(shape=(14,), dtype=tf.float32),
            'velocity': Tensor(shape=(9,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor tf.float32
pasos conjunto de datos
pasos/acción Tensor (6,) tf.float32
pasos/descuento Tensor (1,) tf.float32
pasos/es_primero Tensor tf.bool
pasos/es_último Tensor tf.bool
pasos/es_terminal Tensor tf.bool
pasos/observación CaracterísticasDict
pasos/observación/altura Tensor (1,) tf.float32
pasos/observación/orientaciones Tensor (14,) tf.float32
pasos/observación/velocidad Tensor (9,) tf.float32
pasos/recompensa Tensor (1,) tf.float32

rlu_rwrl/walker_walk_combined_challenge_none_100_percent

  • Tamaño del conjunto de datos : 626.86 MiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 5,000
  • Estructura de características :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=tf.float32),
            'orientations': Tensor(shape=(14,), dtype=tf.float32),
            'velocity': Tensor(shape=(9,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor tf.float32
pasos conjunto de datos
pasos/acción Tensor (6,) tf.float32
pasos/descuento Tensor (1,) tf.float32
pasos/es_primero Tensor tf.bool
pasos/es_último Tensor tf.bool
pasos/es_terminal Tensor tf.bool
pasos/observación CaracterísticasDict
pasos/observación/altura Tensor (1,) tf.float32
pasos/observación/orientaciones Tensor (14,) tf.float32
pasos/observación/velocidad Tensor (9,) tf.float32
pasos/recompensa Tensor (1,) tf.float32

rlu_rwrl/humanoid_walk_combined_challenge_none_1_percent

  • Tamaño del conjunto de datos : 69.40 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 200
  • Estructura de características :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=tf.float32),
            'extremities': Tensor(shape=(12,), dtype=tf.float32),
            'head_height': Tensor(shape=(1,), dtype=tf.float32),
            'joint_angles': Tensor(shape=(21,), dtype=tf.float32),
            'torso_vertical': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(27,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor tf.float32
pasos conjunto de datos
pasos/acción Tensor (21,) tf.float32
pasos/descuento Tensor (1,) tf.float32
pasos/es_primero Tensor tf.bool
pasos/es_último Tensor tf.bool
pasos/es_terminal Tensor tf.bool
pasos/observación CaracterísticasDict
pasos/observación/com_velocidad Tensor (3,) tf.float32
pasos/observación/extremidades Tensor (12,) tf.float32
pasos/observación/cabeza_altura Tensor (1,) tf.float32
pasos/observación/joint_angles Tensor (21,) tf.float32
pasos/observación/torso_vertical Tensor (3,) tf.float32
pasos/observación/velocidad Tensor (27,) tf.float32
pasos/recompensa Tensor (1,) tf.float32

rlu_rwrl/humanoid_walk_combined_challenge_none_5_percent

  • Tamaño del conjunto de datos : 346.98 MiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 1,000
  • Estructura de características :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=tf.float32),
            'extremities': Tensor(shape=(12,), dtype=tf.float32),
            'head_height': Tensor(shape=(1,), dtype=tf.float32),
            'joint_angles': Tensor(shape=(21,), dtype=tf.float32),
            'torso_vertical': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(27,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor tf.float32
pasos conjunto de datos
pasos/acción Tensor (21,) tf.float32
pasos/descuento Tensor (1,) tf.float32
pasos/es_primero Tensor tf.bool
pasos/es_último Tensor tf.bool
pasos/es_terminal Tensor tf.bool
pasos/observación CaracterísticasDict
pasos/observación/com_velocidad Tensor (3,) tf.float32
pasos/observación/extremidades Tensor (12,) tf.float32
pasos/observación/cabeza_altura Tensor (1,) tf.float32
pasos/observación/joint_angles Tensor (21,) tf.float32
pasos/observación/torso_vertical Tensor (3,) tf.float32
pasos/observación/velocidad Tensor (27,) tf.float32
pasos/recompensa Tensor (1,) tf.float32

rlu_rwrl/humanoid_walk_combined_challenge_none_20_percent

  • Tamaño del conjunto de datos : 1.36 GiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 4,000
  • Estructura de características :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=tf.float32),
            'extremities': Tensor(shape=(12,), dtype=tf.float32),
            'head_height': Tensor(shape=(1,), dtype=tf.float32),
            'joint_angles': Tensor(shape=(21,), dtype=tf.float32),
            'torso_vertical': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(27,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor tf.float32
pasos conjunto de datos
pasos/acción Tensor (21,) tf.float32
pasos/descuento Tensor (1,) tf.float32
pasos/es_primero Tensor tf.bool
pasos/es_último Tensor tf.bool
pasos/es_terminal Tensor tf.bool
pasos/observación CaracterísticasDict
pasos/observación/com_velocidad Tensor (3,) tf.float32
pasos/observación/extremidades Tensor (12,) tf.float32
pasos/observación/cabeza_altura Tensor (1,) tf.float32
pasos/observación/joint_angles Tensor (21,) tf.float32
pasos/observación/torso_vertical Tensor (3,) tf.float32
pasos/observación/velocidad Tensor (27,) tf.float32
pasos/recompensa Tensor (1,) tf.float32

rlu_rwrl/humanoid_walk_combined_challenge_none_40_percent

  • Tamaño del conjunto de datos : 2.71 GiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 8,000
  • Estructura de características :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=tf.float32),
            'extremities': Tensor(shape=(12,), dtype=tf.float32),
            'head_height': Tensor(shape=(1,), dtype=tf.float32),
            'joint_angles': Tensor(shape=(21,), dtype=tf.float32),
            'torso_vertical': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(27,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor tf.float32
pasos conjunto de datos
pasos/acción Tensor (21,) tf.float32
pasos/descuento Tensor (1,) tf.float32
pasos/es_primero Tensor tf.bool
pasos/es_último Tensor tf.bool
pasos/es_terminal Tensor tf.bool
pasos/observación CaracterísticasDict
pasos/observación/com_velocidad Tensor (3,) tf.float32
pasos/observación/extremidades Tensor (12,) tf.float32
pasos/observación/cabeza_altura Tensor (1,) tf.float32
pasos/observación/joint_angles Tensor (21,) tf.float32
pasos/observación/torso_vertical Tensor (3,) tf.float32
pasos/observación/velocidad Tensor (27,) tf.float32
pasos/recompensa Tensor (1,) tf.float32

rlu_rwrl/humanoid_walk_combined_challenge_none_100_percent

  • Tamaño del conjunto de datos : 6.78 GiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 20,000
  • Estructura de características :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=tf.float32),
            'extremities': Tensor(shape=(12,), dtype=tf.float32),
            'head_height': Tensor(shape=(1,), dtype=tf.float32),
            'joint_angles': Tensor(shape=(21,), dtype=tf.float32),
            'torso_vertical': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(27,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor tf.float32
pasos conjunto de datos
pasos/acción Tensor (21,) tf.float32
pasos/descuento Tensor (1,) tf.float32
pasos/es_primero Tensor tf.bool
pasos/es_último Tensor tf.bool
pasos/es_terminal Tensor tf.bool
pasos/observación CaracterísticasDict
pasos/observación/com_velocidad Tensor (3,) tf.float32
pasos/observación/extremidades Tensor (12,) tf.float32
pasos/observación/cabeza_altura Tensor (1,) tf.float32
pasos/observación/joint_angles Tensor (21,) tf.float32
pasos/observación/torso_vertical Tensor (3,) tf.float32
pasos/observación/velocidad Tensor (27,) tf.float32
pasos/recompensa Tensor (1,) tf.float32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_1_percent

  • Tamaño del conjunto de datos : 369.84 KiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 5
  • Estructura de características :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'position': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(2,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor tf.float32
pasos conjunto de datos
pasos/acción Tensor (1,) tf.float32
pasos/descuento Tensor (1,) tf.float32
pasos/es_primero Tensor tf.bool
pasos/es_último Tensor tf.bool
pasos/es_terminal Tensor tf.bool
pasos/observación CaracterísticasDict
pasos/observación/dummy-0 Tensor (1,) tf.float32
pasos/observación/dummy-1 Tensor (1,) tf.float32
pasos/observación/dummy-2 Tensor (1,) tf.float32
pasos/observación/dummy-3 Tensor (1,) tf.float32
pasos/observación/dummy-4 Tensor (1,) tf.float32
pasos/observación/dummy-5 Tensor (1,) tf.float32
pasos/observación/dummy-6 Tensor (1,) tf.float32
pasos/observación/dummy-7 Tensor (1,) tf.float32
pasos/observación/ficticio-8 Tensor (1,) tf.float32
pasos/observación/ficticio-9 Tensor (1,) tf.float32
pasos/observación/posición Tensor (3,) tf.float32
pasos/observación/velocidad Tensor (2,) tf.float32
pasos/recompensa Tensor (1,) tf.float32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_5_percent

  • Tamaño del conjunto de datos : 1.81 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 25
  • Estructura de características :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'position': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(2,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor tf.float32
pasos conjunto de datos
pasos/acción Tensor (1,) tf.float32
pasos/descuento Tensor (1,) tf.float32
pasos/es_primero Tensor tf.bool
pasos/es_último Tensor tf.bool
pasos/es_terminal Tensor tf.bool
pasos/observación CaracterísticasDict
pasos/observación/dummy-0 Tensor (1,) tf.float32
pasos/observación/dummy-1 Tensor (1,) tf.float32
pasos/observación/dummy-2 Tensor (1,) tf.float32
pasos/observación/dummy-3 Tensor (1,) tf.float32
pasos/observación/dummy-4 Tensor (1,) tf.float32
pasos/observación/dummy-5 Tensor (1,) tf.float32
pasos/observación/dummy-6 Tensor (1,) tf.float32
pasos/observación/dummy-7 Tensor (1,) tf.float32
pasos/observación/ficticio-8 Tensor (1,) tf.float32
pasos/observación/ficticio-9 Tensor (1,) tf.float32
pasos/observación/posición Tensor (3,) tf.float32
pasos/observación/velocidad Tensor (2,) tf.float32
pasos/recompensa Tensor (1,) tf.float32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_20_percent

  • Tamaño del conjunto de datos : 7.22 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 100
  • Estructura de características :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'position': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(2,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor tf.float32
pasos conjunto de datos
pasos/acción Tensor (1,) tf.float32
pasos/descuento Tensor (1,) tf.float32
pasos/es_primero Tensor tf.bool
pasos/es_último Tensor tf.bool
pasos/es_terminal Tensor tf.bool
pasos/observación CaracterísticasDict
pasos/observación/dummy-0 Tensor (1,) tf.float32
pasos/observación/dummy-1 Tensor (1,) tf.float32
pasos/observación/dummy-2 Tensor (1,) tf.float32
pasos/observación/dummy-3 Tensor (1,) tf.float32
pasos/observación/dummy-4 Tensor (1,) tf.float32
pasos/observación/dummy-5 Tensor (1,) tf.float32
pasos/observación/dummy-6 Tensor (1,) tf.float32
pasos/observación/dummy-7 Tensor (1,) tf.float32
pasos/observación/ficticio-8 Tensor (1,) tf.float32
pasos/observación/ficticio-9 Tensor (1,) tf.float32
pasos/observación/posición Tensor (3,) tf.float32
pasos/observación/velocidad Tensor (2,) tf.float32
pasos/recompensa Tensor (1,) tf.float32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_40_percent

  • Tamaño del conjunto de datos : 14.45 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 200
  • Estructura de características :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'position': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(2,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor tf.float32
pasos conjunto de datos
pasos/acción Tensor (1,) tf.float32
pasos/descuento Tensor (1,) tf.float32
pasos/es_primero Tensor tf.bool
pasos/es_último Tensor tf.bool
pasos/es_terminal Tensor tf.bool
pasos/observación CaracterísticasDict
pasos/observación/dummy-0 Tensor (1,) tf.float32
pasos/observación/dummy-1 Tensor (1,) tf.float32
pasos/observación/dummy-2 Tensor (1,) tf.float32
pasos/observación/dummy-3 Tensor (1,) tf.float32
pasos/observación/dummy-4 Tensor (1,) tf.float32
pasos/observación/dummy-5 Tensor (1,) tf.float32
pasos/observación/dummy-6 Tensor (1,) tf.float32
pasos/observación/dummy-7 Tensor (1,) tf.float32
pasos/observación/ficticio-8 Tensor (1,) tf.float32
pasos/observación/ficticio-9 Tensor (1,) tf.float32
pasos/observación/posición Tensor (3,) tf.float32
pasos/observación/velocidad Tensor (2,) tf.float32
pasos/recompensa Tensor (1,) tf.float32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_100_percent

  • Tamaño del conjunto de datos : 36.12 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 500
  • Estructura de características :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'position': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(2,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor tf.float32
pasos conjunto de datos
pasos/acción Tensor (1,) tf.float32
pasos/descuento Tensor (1,) tf.float32
pasos/es_primero Tensor tf.bool
pasos/es_último Tensor tf.bool
pasos/es_terminal Tensor tf.bool
pasos/observación CaracterísticasDict
pasos/observación/dummy-0 Tensor (1,) tf.float32
pasos/observación/dummy-1 Tensor (1,) tf.float32
pasos/observación/dummy-2 Tensor (1,) tf.float32
pasos/observación/dummy-3 Tensor (1,) tf.float32
pasos/observación/dummy-4 Tensor (1,) tf.float32
pasos/observación/dummy-5 Tensor (1,) tf.float32
pasos/observación/dummy-6 Tensor (1,) tf.float32
pasos/observación/dummy-7 Tensor (1,) tf.float32
pasos/observación/ficticio-8 Tensor (1,) tf.float32
pasos/observación/ficticio-9 Tensor (1,) tf.float32
pasos/observación/posición Tensor (3,) tf.float32
pasos/observación/velocidad Tensor (2,) tf.float32
pasos/recompensa Tensor (1,) tf.float32

rlu_rwrl/quadruped_walk_combined_challenge_easy_1_percent

  • Tamaño del conjunto de datos : 1.97 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 5
  • Estructura de características :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'egocentric_state': Tensor(shape=(44,), dtype=tf.float32),
            'force_torque': Tensor(shape=(24,), dtype=tf.float32),
            'imu': Tensor(shape=(6,), dtype=tf.float32),
            'torso_upright': Tensor(shape=(1,), dtype=tf.float32),
            'torso_velocity': Tensor(shape=(3,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor tf.float32
pasos conjunto de datos
pasos/acción Tensor (12,) tf.float32
pasos/descuento Tensor (1,) tf.float32
pasos/es_primero Tensor tf.bool
pasos/es_último Tensor tf.bool
pasos/es_terminal Tensor tf.bool
pasos/observación CaracterísticasDict
pasos/observación/dummy-0 Tensor (1,) tf.float32
pasos/observación/dummy-1 Tensor (1,) tf.float32
pasos/observación/dummy-2 Tensor (1,) tf.float32
pasos/observación/dummy-3 Tensor (1,) tf.float32
pasos/observación/dummy-4 Tensor (1,) tf.float32
pasos/observación/dummy-5 Tensor (1,) tf.float32
pasos/observación/dummy-6 Tensor (1,) tf.float32
pasos/observación/dummy-7 Tensor (1,) tf.float32
pasos/observación/ficticio-8 Tensor (1,) tf.float32
pasos/observación/ficticio-9 Tensor (1,) tf.float32
pasos/observación/estado_egocéntrico Tensor (44,) tf.float32
pasos/observación/force_torque Tensor (24,) tf.float32
pasos/observación/imu Tensor (6,) tf.float32
pasos/observación/torso_vertical Tensor (1,) tf.float32
pasos/observación/torso_velocidad Tensor (3,) tf.float32
pasos/recompensa Tensor (1,) tf.float32

rlu_rwrl/quadruped_walk_combined_challenge_easy_5_percent

  • Tamaño del conjunto de datos : 9.83 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 25
  • Estructura de características :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'egocentric_state': Tensor(shape=(44,), dtype=tf.float32),
            'force_torque': Tensor(shape=(24,), dtype=tf.float32),
            'imu': Tensor(shape=(6,), dtype=tf.float32),
            'torso_upright': Tensor(shape=(1,), dtype=tf.float32),
            'torso_velocity': Tensor(shape=(3,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor tf.float32
pasos conjunto de datos
pasos/acción Tensor (12,) tf.float32
pasos/descuento Tensor (1,) tf.float32
pasos/es_primero Tensor tf.bool
pasos/es_último Tensor tf.bool
pasos/es_terminal Tensor tf.bool
pasos/observación CaracterísticasDict
pasos/observación/dummy-0 Tensor (1,) tf.float32
pasos/observación/dummy-1 Tensor (1,) tf.float32
pasos/observación/dummy-2 Tensor (1,) tf.float32
pasos/observación/dummy-3 Tensor (1,) tf.float32
pasos/observación/dummy-4 Tensor (1,) tf.float32
pasos/observación/dummy-5 Tensor (1,) tf.float32
pasos/observación/dummy-6 Tensor (1,) tf.float32
pasos/observación/dummy-7 Tensor (1,) tf.float32
pasos/observación/ficticio-8 Tensor (1,) tf.float32
pasos/observación/ficticio-9 Tensor (1,) tf.float32
pasos/observación/estado_egocéntrico Tensor (44,) tf.float32
pasos/observación/force_torque Tensor (24,) tf.float32
pasos/observación/imu Tensor (6,) tf.float32
pasos/observación/torso_vertical Tensor (1,) tf.float32
pasos/observación/torso_velocidad Tensor (3,) tf.float32
pasos/recompensa Tensor (1,) tf.float32

rlu_rwrl/quadruped_walk_combined_challenge_easy_20_percent

  • Tamaño del conjunto de datos : 39.31 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 100
  • Estructura de características :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'egocentric_state': Tensor(shape=(44,), dtype=tf.float32),
            'force_torque': Tensor(shape=(24,), dtype=tf.float32),
            'imu': Tensor(shape=(6,), dtype=tf.float32),
            'torso_upright': Tensor(shape=(1,), dtype=tf.float32),
            'torso_velocity': Tensor(shape=(3,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor tf.float32
pasos conjunto de datos
pasos/acción Tensor (12,) tf.float32
pasos/descuento Tensor (1,) tf.float32
pasos/es_primero Tensor tf.bool
pasos/es_último Tensor tf.bool
pasos/es_terminal Tensor tf.bool
pasos/observación CaracterísticasDict
pasos/observación/dummy-0 Tensor (1,) tf.float32
pasos/observación/dummy-1 Tensor (1,) tf.float32
pasos/observación/dummy-2 Tensor (1,) tf.float32
pasos/observación/dummy-3 Tensor (1,) tf.float32
pasos/observación/dummy-4 Tensor (1,) tf.float32
pasos/observación/dummy-5 Tensor (1,) tf.float32
pasos/observación/dummy-6 Tensor (1,) tf.float32
pasos/observación/dummy-7 Tensor (1,) tf.float32
pasos/observación/ficticio-8 Tensor (1,) tf.float32
pasos/observación/ficticio-9 Tensor (1,) tf.float32
pasos/observación/estado_egocéntrico Tensor (44,) tf.float32
pasos/observación/force_torque Tensor (24,) tf.float32
pasos/observación/imu Tensor (6,) tf.float32
pasos/observación/torso_vertical Tensor (1,) tf.float32
pasos/observación/torso_velocidad Tensor (3,) tf.float32
pasos/recompensa Tensor (1,) tf.float32

rlu_rwrl/quadruped_walk_combined_challenge_easy_40_percent

  • Tamaño del conjunto de datos : 78.63 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 200
  • Estructura de características :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'egocentric_state': Tensor(shape=(44,), dtype=tf.float32),
            'force_torque': Tensor(shape=(24,), dtype=tf.float32),
            'imu': Tensor(shape=(6,), dtype=tf.float32),
            'torso_upright': Tensor(shape=(1,), dtype=tf.float32),
            'torso_velocity': Tensor(shape=(3,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor tf.float32
pasos conjunto de datos
pasos/acción Tensor (12,) tf.float32
pasos/descuento Tensor (1,) tf.float32
pasos/es_primero Tensor tf.bool
pasos/es_último Tensor tf.bool
pasos/es_terminal Tensor tf.bool
pasos/observación CaracterísticasDict
pasos/observación/dummy-0 Tensor (1,) tf.float32
pasos/observación/dummy-1 Tensor (1,) tf.float32
pasos/observación/dummy-2 Tensor (1,) tf.float32
pasos/observación/dummy-3 Tensor (1,) tf.float32
pasos/observación/dummy-4 Tensor (1,) tf.float32
pasos/observación/dummy-5 Tensor (1,) tf.float32
pasos/observación/dummy-6 Tensor (1,) tf.float32
pasos/observación/dummy-7 Tensor (1,) tf.float32
pasos/observación/ficticio-8 Tensor (1,) tf.float32
pasos/observación/ficticio-9 Tensor (1,) tf.float32
pasos/observación/estado_egocéntrico Tensor (44,) tf.float32
pasos/observación/force_torque Tensor (24,) tf.float32
pasos/observación/imu Tensor (6,) tf.float32
pasos/observación/torso_vertical Tensor (1,) tf.float32
pasos/observación/torso_velocidad Tensor (3,) tf.float32
pasos/recompensa Tensor (1,) tf.float32

rlu_rwrl/quadruped_walk_combined_challenge_easy_100_percent

  • Tamaño del conjunto de datos : 196.57 MiB

  • Auto-caché ( documentación ): Solo cuando shuffle_files=False (tren)

  • Divisiones :

Separar Ejemplos
'train' 500
  • Estructura de características :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'egocentric_state': Tensor(shape=(44,), dtype=tf.float32),
            'force_torque': Tensor(shape=(24,), dtype=tf.float32),
            'imu': Tensor(shape=(6,), dtype=tf.float32),
            'torso_upright': Tensor(shape=(1,), dtype=tf.float32),
            'torso_velocity': Tensor(shape=(3,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor tf.float32
pasos conjunto de datos
pasos/acción Tensor (12,) tf.float32
pasos/descuento Tensor (1,) tf.float32
pasos/es_primero Tensor tf.bool
pasos/es_último Tensor tf.bool
pasos/es_terminal Tensor tf.bool
pasos/observación CaracterísticasDict
pasos/observación/dummy-0 Tensor (1,) tf.float32
pasos/observación/dummy-1 Tensor (1,) tf.float32
pasos/observación/dummy-2 Tensor (1,) tf.float32
pasos/observación/dummy-3 Tensor (1,) tf.float32
pasos/observación/dummy-4 Tensor (1,) tf.float32
pasos/observación/dummy-5 Tensor (1,) tf.float32
pasos/observación/dummy-6 Tensor (1,) tf.float32
pasos/observación/dummy-7 Tensor (1,) tf.float32
pasos/observación/ficticio-8 Tensor (1,) tf.float32
pasos/observación/ficticio-9 Tensor (1,) tf.float32
pasos/observación/estado_egocéntrico Tensor (44,) tf.float32
pasos/observación/force_torque Tensor (24,) tf.float32
pasos/observación/imu Tensor (6,) tf.float32
pasos/observación/torso_vertical Tensor (1,) tf.float32
pasos/observación/torso_velocidad Tensor (3,) tf.float32
pasos/recompensa Tensor (1,) tf.float32

rlu_rwrl/walker_walk_combined_challenge_easy_1_percent

  • Tamaño del conjunto de datos : 8.20 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 50
  • Estructura de características :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'height': Tensor(shape=(1,), dtype=tf.float32),
            'orientations': Tensor(shape=(14,), dtype=tf.float32),
            'velocity': Tensor(shape=(9,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor tf.float32
pasos conjunto de datos
pasos/acción Tensor (6,) tf.float32
pasos/descuento Tensor (1,) tf.float32
pasos/es_primero Tensor tf.bool
pasos/es_último Tensor tf.bool
pasos/es_terminal Tensor tf.bool
pasos/observación CaracterísticasDict
pasos/observación/dummy-0 Tensor (1,) tf.float32
pasos/observación/dummy-1 Tensor (1,) tf.float32
pasos/observación/dummy-2 Tensor (1,) tf.float32
pasos/observación/dummy-3 Tensor (1,) tf.float32
pasos/observación/dummy-4 Tensor (1,) tf.float32
pasos/observación/dummy-5 Tensor (1,) tf.float32
pasos/observación/dummy-6 Tensor (1,) tf.float32
pasos/observación/dummy-7 Tensor (1,) tf.float32
pasos/observación/ficticio-8 Tensor (1,) tf.float32
pasos/observación/ficticio-9 Tensor (1,) tf.float32
pasos/observación/altura Tensor (1,) tf.float32
pasos/observación/orientaciones Tensor (14,) tf.float32
pasos/observación/velocidad Tensor (9,) tf.float32
pasos/recompensa Tensor (1,) tf.float32

rlu_rwrl/walker_walk_combined_challenge_easy_5_percent

  • Tamaño del conjunto de datos : 40.98 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 250
  • Estructura de características :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'height': Tensor(shape=(1,), dtype=tf.float32),
            'orientations': Tensor(shape=(14,), dtype=tf.float32),
            'velocity': Tensor(shape=(9,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor tf.float32
pasos conjunto de datos
pasos/acción Tensor (6,) tf.float32
pasos/descuento Tensor (1,) tf.float32
pasos/es_primero Tensor tf.bool
pasos/es_último Tensor tf.bool
pasos/es_terminal Tensor tf.bool
pasos/observación CaracterísticasDict
pasos/observación/dummy-0 Tensor (1,) tf.float32
pasos/observación/dummy-1 Tensor (1,) tf.float32
pasos/observación/dummy-2 Tensor (1,) tf.float32
pasos/observación/dummy-3 Tensor (1,) tf.float32
pasos/observación/dummy-4 Tensor (1,) tf.float32
pasos/observación/dummy-5 Tensor (1,) tf.float32
pasos/observación/dummy-6 Tensor (1,) tf.float32
pasos/observación/dummy-7 Tensor (1,) tf.float32
pasos/observación/ficticio-8 Tensor (1,) tf.float32
pasos/observación/ficticio-9 Tensor (1,) tf.float32
pasos/observación/altura Tensor (1,) tf.float32
pasos/observación/orientaciones Tensor (14,) tf.float32
pasos/observación/velocidad Tensor (9,) tf.float32
pasos/recompensa Tensor (1,) tf.float32

rlu_rwrl/walker_walk_combined_challenge_easy_20_percent

  • Tamaño del conjunto de datos : 163.93 MiB

  • Auto-caché ( documentación ): Solo cuando shuffle_files=False (tren)

  • Divisiones :

Separar Ejemplos
'train' 1,000
  • Estructura de características :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'height': Tensor(shape=(1,), dtype=tf.float32),
            'orientations': Tensor(shape=(14,), dtype=tf.float32),
            'velocity': Tensor(shape=(9,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor tf.float32
pasos conjunto de datos
pasos/acción Tensor (6,) tf.float32
pasos/descuento Tensor (1,) tf.float32
pasos/es_primero Tensor tf.bool
pasos/es_último Tensor tf.bool
pasos/es_terminal Tensor tf.bool
pasos/observación CaracterísticasDict
pasos/observación/dummy-0 Tensor (1,) tf.float32
pasos/observación/dummy-1 Tensor (1,) tf.float32
pasos/observación/dummy-2 Tensor (1,) tf.float32
pasos/observación/dummy-3 Tensor (1,) tf.float32
pasos/observación/dummy-4 Tensor (1,) tf.float32
pasos/observación/dummy-5 Tensor (1,) tf.float32
pasos/observación/dummy-6 Tensor (1,) tf.float32
pasos/observación/dummy-7 Tensor (1,) tf.float32
pasos/observación/ficticio-8 Tensor (1,) tf.float32
pasos/observación/ficticio-9 Tensor (1,) tf.float32
pasos/observación/altura Tensor (1,) tf.float32
pasos/observación/orientaciones Tensor (14,) tf.float32
pasos/observación/velocidad Tensor (9,) tf.float32
pasos/recompensa Tensor (1,) tf.float32

rlu_rwrl/walker_walk_combined_challenge_easy_40_percent

  • Tamaño del conjunto de datos : 327.86 MiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 2,000
  • Estructura de características :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'height': Tensor(shape=(1,), dtype=tf.float32),
            'orientations': Tensor(shape=(14,), dtype=tf.float32),
            'velocity': Tensor(shape=(9,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor tf.float32
pasos conjunto de datos
pasos/acción Tensor (6,) tf.float32
pasos/descuento Tensor (1,) tf.float32
pasos/es_primero Tensor tf.bool
pasos/es_último Tensor tf.bool
pasos/es_terminal Tensor tf.bool
steps/observation FeaturesDict
steps/observation/dummy-0 Tensor (1,) tf.float32
steps/observation/dummy-1 Tensor (1,) tf.float32
steps/observation/dummy-2 Tensor (1,) tf.float32
steps/observation/dummy-3 Tensor (1,) tf.float32
steps/observation/dummy-4 Tensor (1,) tf.float32
steps/observation/dummy-5 Tensor (1,) tf.float32
steps/observation/dummy-6 Tensor (1,) tf.float32
steps/observation/dummy-7 Tensor (1,) tf.float32
steps/observation/dummy-8 Tensor (1,) tf.float32
steps/observation/dummy-9 Tensor (1,) tf.float32
steps/observation/height Tensor (1,) tf.float32
steps/observation/orientations Tensor (14,) tf.float32
steps/observation/velocity Tensor (9,) tf.float32
steps/reward Tensor (1,) tf.float32

rlu_rwrl/walker_walk_combined_challenge_easy_100_percent

  • Dataset size : 819.65 MiB

  • Auto-cached ( documentation ): No

  • Splits :

Split Examples
'train' 5,000
  • Feature structure :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'height': Tensor(shape=(1,), dtype=tf.float32),
            'orientations': Tensor(shape=(14,), dtype=tf.float32),
            'velocity': Tensor(shape=(9,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Feature documentation :
Feature Class Shape Dtype Description
FeaturesDict
episode_return Tensor tf.float32
steps Dataset
steps/action Tensor (6,) tf.float32
steps/discount Tensor (1,) tf.float32
steps/is_first Tensor tf.bool
steps/is_last Tensor tf.bool
steps/is_terminal Tensor tf.bool
steps/observation FeaturesDict
steps/observation/dummy-0 Tensor (1,) tf.float32
steps/observation/dummy-1 Tensor (1,) tf.float32
steps/observation/dummy-2 Tensor (1,) tf.float32
steps/observation/dummy-3 Tensor (1,) tf.float32
steps/observation/dummy-4 Tensor (1,) tf.float32
steps/observation/dummy-5 Tensor (1,) tf.float32
steps/observation/dummy-6 Tensor (1,) tf.float32
steps/observation/dummy-7 Tensor (1,) tf.float32
steps/observation/dummy-8 Tensor (1,) tf.float32
steps/observation/dummy-9 Tensor (1,) tf.float32
steps/observation/height Tensor (1,) tf.float32
steps/observation/orientations Tensor (14,) tf.float32
steps/observation/velocity Tensor (9,) tf.float32
steps/reward Tensor (1,) tf.float32

rlu_rwrl/humanoid_walk_combined_challenge_easy_1_percent

  • Dataset size : 77.11 MiB

  • Auto-cached ( documentation ): Yes

  • Splits :

Split Examples
'train' 200
  • Feature structure :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=tf.float32),
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'extremities': Tensor(shape=(12,), dtype=tf.float32),
            'head_height': Tensor(shape=(1,), dtype=tf.float32),
            'joint_angles': Tensor(shape=(21,), dtype=tf.float32),
            'torso_vertical': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(27,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Feature documentation :
Feature Class Shape Dtype Description
FeaturesDict
episode_return Tensor tf.float32
steps Dataset
steps/action Tensor (21,) tf.float32
steps/discount Tensor (1,) tf.float32
steps/is_first Tensor tf.bool
steps/is_last Tensor tf.bool
steps/is_terminal Tensor tf.bool
steps/observation FeaturesDict
steps/observation/com_velocity Tensor (3,) tf.float32
steps/observation/dummy-0 Tensor (1,) tf.float32
steps/observation/dummy-1 Tensor (1,) tf.float32
steps/observation/dummy-2 Tensor (1,) tf.float32
steps/observation/dummy-3 Tensor (1,) tf.float32
steps/observation/dummy-4 Tensor (1,) tf.float32
steps/observation/dummy-5 Tensor (1,) tf.float32
steps/observation/dummy-6 Tensor (1,) tf.float32
steps/observation/dummy-7 Tensor (1,) tf.float32
steps/observation/dummy-8 Tensor (1,) tf.float32
steps/observation/dummy-9 Tensor (1,) tf.float32
steps/observation/extremities Tensor (12,) tf.float32
steps/observation/head_height Tensor (1,) tf.float32
steps/observation/joint_angles Tensor (21,) tf.float32
steps/observation/torso_vertical Tensor (3,) tf.float32
steps/observation/velocity Tensor (27,) tf.float32
steps/reward Tensor (1,) tf.float32

rlu_rwrl/humanoid_walk_combined_challenge_easy_5_percent

  • Dataset size : 385.54 MiB

  • Auto-cached ( documentation ): No

  • Splits :

Split Examples
'train' 1,000
  • Feature structure :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=tf.float32),
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'extremities': Tensor(shape=(12,), dtype=tf.float32),
            'head_height': Tensor(shape=(1,), dtype=tf.float32),
            'joint_angles': Tensor(shape=(21,), dtype=tf.float32),
            'torso_vertical': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(27,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Feature documentation :
Feature Class Shape Dtype Description
FeaturesDict
episode_return Tensor tf.float32
steps Dataset
steps/action Tensor (21,) tf.float32
steps/discount Tensor (1,) tf.float32
steps/is_first Tensor tf.bool
steps/is_last Tensor tf.bool
steps/is_terminal Tensor tf.bool
steps/observation FeaturesDict
steps/observation/com_velocity Tensor (3,) tf.float32
steps/observation/dummy-0 Tensor (1,) tf.float32
steps/observation/dummy-1 Tensor (1,) tf.float32
steps/observation/dummy-2 Tensor (1,) tf.float32
steps/observation/dummy-3 Tensor (1,) tf.float32
steps/observation/dummy-4 Tensor (1,) tf.float32
steps/observation/dummy-5 Tensor (1,) tf.float32
steps/observation/dummy-6 Tensor (1,) tf.float32
steps/observation/dummy-7 Tensor (1,) tf.float32
steps/observation/dummy-8 Tensor (1,) tf.float32
steps/observation/dummy-9 Tensor (1,) tf.float32
steps/observation/extremities Tensor (12,) tf.float32
steps/observation/head_height Tensor (1,) tf.float32
steps/observation/joint_angles Tensor (21,) tf.float32
steps/observation/torso_vertical Tensor (3,) tf.float32
steps/observation/velocity Tensor (27,) tf.float32
steps/reward Tensor (1,) tf.float32

rlu_rwrl/humanoid_walk_combined_challenge_easy_20_percent

  • Dataset size : 1.51 GiB

  • Auto-cached ( documentation ): No

  • Splits :

Split Examples
'train' 4,000
  • Feature structure :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=tf.float32),
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'extremities': Tensor(shape=(12,), dtype=tf.float32),
            'head_height': Tensor(shape=(1,), dtype=tf.float32),
            'joint_angles': Tensor(shape=(21,), dtype=tf.float32),
            'torso_vertical': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(27,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Feature documentation :
Feature Class Shape Dtype Description
FeaturesDict
episode_return Tensor tf.float32
steps Dataset
steps/action Tensor (21,) tf.float32
steps/discount Tensor (1,) tf.float32
steps/is_first Tensor tf.bool
steps/is_last Tensor tf.bool
steps/is_terminal Tensor tf.bool
steps/observation FeaturesDict
steps/observation/com_velocity Tensor (3,) tf.float32
steps/observation/dummy-0 Tensor (1,) tf.float32
steps/observation/dummy-1 Tensor (1,) tf.float32
steps/observation/dummy-2 Tensor (1,) tf.float32
steps/observation/dummy-3 Tensor (1,) tf.float32
steps/observation/dummy-4 Tensor (1,) tf.float32
steps/observation/dummy-5 Tensor (1,) tf.float32
steps/observation/dummy-6 Tensor (1,) tf.float32
steps/observation/dummy-7 Tensor (1,) tf.float32
steps/observation/dummy-8 Tensor (1,) tf.float32
steps/observation/dummy-9 Tensor (1,) tf.float32
steps/observation/extremities Tensor (12,) tf.float32
steps/observation/head_height Tensor (1,) tf.float32
steps/observation/joint_angles Tensor (21,) tf.float32
steps/observation/torso_vertical Tensor (3,) tf.float32
steps/observation/velocity Tensor (27,) tf.float32
steps/reward Tensor (1,) tf.float32

rlu_rwrl/humanoid_walk_combined_challenge_easy_40_percent

  • Dataset size : 3.01 GiB

  • Auto-cached ( documentation ): No

  • Splits :

Split Examples
'train' 8,000
  • Feature structure :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=tf.float32),
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'extremities': Tensor(shape=(12,), dtype=tf.float32),
            'head_height': Tensor(shape=(1,), dtype=tf.float32),
            'joint_angles': Tensor(shape=(21,), dtype=tf.float32),
            'torso_vertical': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(27,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Feature documentation :
Feature Class Shape Dtype Description
FeaturesDict
episode_return Tensor tf.float32
steps Dataset
steps/action Tensor (21,) tf.float32
steps/discount Tensor (1,) tf.float32
steps/is_first Tensor tf.bool
steps/is_last Tensor tf.bool
steps/is_terminal Tensor tf.bool
steps/observation FeaturesDict
steps/observation/com_velocity Tensor (3,) tf.float32
steps/observation/dummy-0 Tensor (1,) tf.float32
steps/observation/dummy-1 Tensor (1,) tf.float32
steps/observation/dummy-2 Tensor (1,) tf.float32
steps/observation/dummy-3 Tensor (1,) tf.float32
steps/observation/dummy-4 Tensor (1,) tf.float32
steps/observation/dummy-5 Tensor (1,) tf.float32
steps/observation/dummy-6 Tensor (1,) tf.float32
steps/observation/dummy-7 Tensor (1,) tf.float32
steps/observation/dummy-8 Tensor (1,) tf.float32
steps/observation/dummy-9 Tensor (1,) tf.float32
steps/observation/extremities Tensor (12,) tf.float32
steps/observation/head_height Tensor (1,) tf.float32
steps/observation/joint_angles Tensor (21,) tf.float32
steps/observation/torso_vertical Tensor (3,) tf.float32
steps/observation/velocity Tensor (27,) tf.float32
steps/reward Tensor (1,) tf.float32

rlu_rwrl/humanoid_walk_combined_challenge_easy_100_percent

  • Dataset size : 7.53 GiB

  • Auto-cached ( documentation ): No

  • Splits :

Split Examples
'train' 20,000
  • Feature structure :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=tf.float32),
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'extremities': Tensor(shape=(12,), dtype=tf.float32),
            'head_height': Tensor(shape=(1,), dtype=tf.float32),
            'joint_angles': Tensor(shape=(21,), dtype=tf.float32),
            'torso_vertical': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(27,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Feature documentation :
Feature Class Shape Dtype Description
FeaturesDict
episode_return Tensor tf.float32
steps Dataset
steps/action Tensor (21,) tf.float32
steps/discount Tensor (1,) tf.float32
steps/is_first Tensor tf.bool
steps/is_last Tensor tf.bool
steps/is_terminal Tensor tf.bool
steps/observation FeaturesDict
steps/observation/com_velocity Tensor (3,) tf.float32
steps/observation/dummy-0 Tensor (1,) tf.float32
steps/observation/dummy-1 Tensor (1,) tf.float32
steps/observation/dummy-2 Tensor (1,) tf.float32
steps/observation/dummy-3 Tensor (1,) tf.float32
steps/observation/dummy-4 Tensor (1,) tf.float32
steps/observation/dummy-5 Tensor (1,) tf.float32
steps/observation/dummy-6 Tensor (1,) tf.float32
steps/observation/dummy-7 Tensor (1,) tf.float32
steps/observation/dummy-8 Tensor (1,) tf.float32
steps/observation/dummy-9 Tensor (1,) tf.float32
steps/observation/extremities Tensor (12,) tf.float32
steps/observation/head_height Tensor (1,) tf.float32
steps/observation/joint_angles Tensor (21,) tf.float32
steps/observation/torso_vertical Tensor (3,) tf.float32
steps/observation/velocity Tensor (27,) tf.float32
steps/reward Tensor (1,) tf.float32