¡TFDS ahora admite el formato Croissant 🥐 ! Lea la documentación para saber más.

Se usó la API de Cloud Translation para traducir esta página.

rlu_rwrl

Descripción :

RL Unplugged es un conjunto de puntos de referencia para el aprendizaje por refuerzo fuera de línea. El RL Unplugged está diseñado en torno a las siguientes consideraciones: para facilitar el uso, proporcionamos los conjuntos de datos con una API unificada que facilita al profesional trabajar con todos los datos en la suite una vez que se ha establecido una canalización general.

Los conjuntos de datos siguen el formato RLDS para representar pasos y episodios.

Los ejemplos en el conjunto de datos representan las transiciones de SAR almacenadas cuando se ejecuta un agente capacitado parcialmente en línea como se describe en https://arxiv.org/abs/1904.12901 Seguimos el formato del conjunto de datos RLDS, como se especifica en https://github.com/google-research /rlds#formato-de-conjunto-de-datos

Lanzamos 40 conjuntos de datos en 8 tareas en total, sin desafío combinado y desafío combinado fácil en las tareas de carro, caminante, cuadrúpedo y humanoide. Cada tarea contiene 5 tamaños diferentes de conjuntos de datos, 1%, 5%, 20%, 40% y 100%. Tenga en cuenta que no se garantiza que el conjunto de datos más pequeño sea un subconjunto de los más grandes. Para obtener detalles sobre cómo se generó el conjunto de datos, consulte el documento.

Página de inicio: https://github.com/deepmind/deepmind-research/tree/master/rl_unplugged
Código fuente : tfds.rl_unplugged.rlu_rwrl.RluRwrl
Versiones :
- 1.0.0 : Versión inicial.
- 1.0.1 (predeterminado): corrige un error en el conjunto de datos RLU RWRL donde hay identificadores de episodios duplicados en uno de los conjuntos de datos humanoides.
Tamaño de descarga : Unknown size
Claves supervisadas (Ver as_supervised doc ): None
Figura ( tfds.show_examples ): no compatible.
Cita :

@misc{gulcehre2020rl,
    title={RL Unplugged: Benchmarks for Offline Reinforcement Learning},
    author={Caglar Gulcehre and Ziyu Wang and Alexander Novikov and Tom Le Paine
        and  Sergio Gómez Colmenarejo and Konrad Zolna and Rishabh Agarwal and
        Josh Merel and Daniel Mankowitz and Cosmin Paduraru and Gabriel
        Dulac-Arnold and Jerry Li and Mohammad Norouzi and Matt Hoffman and
        Ofir Nachum and George Tucker and Nicolas Heess and Nando deFreitas},
    year={2020},
    eprint={2006.13888},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

rlu_rwrl/cartpole_swingup_combined_challenge_none_1_percent (configuración predeterminada)

Tamaño del conjunto de datos : 172.43 KiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :

Separar	Ejemplos
`'train'`	5

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(1,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/posición	Tensor	(3,)	flotar32
pasos/observación/velocidad	Tensor	(2,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/cartpole_swingup_combined_challenge_none_5_percent

Tamaño del conjunto de datos : 862.13 KiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :

Separar	Ejemplos
`'train'`	25

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(1,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/posición	Tensor	(3,)	flotar32
pasos/observación/velocidad	Tensor	(2,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/cartpole_swingup_combined_challenge_none_20_percent

Tamaño del conjunto de datos : 3.37 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :

Separar	Ejemplos
`'train'`	100

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(1,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/posición	Tensor	(3,)	flotar32
pasos/observación/velocidad	Tensor	(2,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/cartpole_swingup_combined_challenge_none_40_percent

Tamaño del conjunto de datos : 6.74 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :

Separar	Ejemplos
`'train'`	200

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(1,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/posición	Tensor	(3,)	flotar32
pasos/observación/velocidad	Tensor	(2,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/cartpole_swingup_combined_challenge_none_100_percent

Tamaño del conjunto de datos : 16.84 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :

Separar	Ejemplos
`'train'`	500

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(1,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/posición	Tensor	(3,)	flotar32
pasos/observación/velocidad	Tensor	(2,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/quadruped_walk_combined_challenge_none_1_percent

Tamaño del conjunto de datos : 1.77 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :

Separar	Ejemplos
`'train'`	5

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(12,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/estado_egocéntrico	Tensor	(44,)	flotar32
pasos/observación/force_torque	Tensor	(24,)	flotar32
pasos/observación/imu	Tensor	(6,)	flotar32
pasos/observación/torso_vertical	Tensor	(1,)	flotar32
pasos/observación/torso_velocidad	Tensor	(3,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/quadruped_walk_combined_challenge_none_5_percent

Tamaño del conjunto de datos : 8.86 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :

Separar	Ejemplos
`'train'`	25

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(12,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/estado_egocéntrico	Tensor	(44,)	flotar32
pasos/observación/force_torque	Tensor	(24,)	flotar32
pasos/observación/imu	Tensor	(6,)	flotar32
pasos/observación/torso_vertical	Tensor	(1,)	flotar32
pasos/observación/torso_velocidad	Tensor	(3,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/quadruped_walk_combined_challenge_none_20_percent

Tamaño del conjunto de datos : 35.46 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :

Separar	Ejemplos
`'train'`	100

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(12,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/estado_egocéntrico	Tensor	(44,)	flotar32
pasos/observación/force_torque	Tensor	(24,)	flotar32
pasos/observación/imu	Tensor	(6,)	flotar32
pasos/observación/torso_vertical	Tensor	(1,)	flotar32
pasos/observación/torso_velocidad	Tensor	(3,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/quadruped_walk_combined_challenge_none_40_percent

Tamaño del conjunto de datos : 70.92 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :

Separar	Ejemplos
`'train'`	200

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(12,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/estado_egocéntrico	Tensor	(44,)	flotar32
pasos/observación/force_torque	Tensor	(24,)	flotar32
pasos/observación/imu	Tensor	(6,)	flotar32
pasos/observación/torso_vertical	Tensor	(1,)	flotar32
pasos/observación/torso_velocidad	Tensor	(3,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/quadruped_walk_combined_challenge_none_100_percent

Tamaño del conjunto de datos : 177.29 MiB
Auto-caché ( documentación ): Solo cuando shuffle_files=False (tren)
Divisiones :

Separar	Ejemplos
`'train'`	500

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(12,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/estado_egocéntrico	Tensor	(44,)	flotar32
pasos/observación/force_torque	Tensor	(24,)	flotar32
pasos/observación/imu	Tensor	(6,)	flotar32
pasos/observación/torso_vertical	Tensor	(1,)	flotar32
pasos/observación/torso_velocidad	Tensor	(3,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/walker_walk_combined_challenge_none_1_percent

Tamaño del conjunto de datos : 6.27 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :

Separar	Ejemplos
`'train'`	50

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(6,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/altura	Tensor	(1,)	flotar32
pasos/observación/orientaciones	Tensor	(14,)	flotar32
pasos/observación/velocidad	Tensor	(9,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/walker_walk_combined_challenge_none_5_percent

Tamaño del conjunto de datos : 31.34 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :

Separar	Ejemplos
`'train'`	250

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(6,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/altura	Tensor	(1,)	flotar32
pasos/observación/orientaciones	Tensor	(14,)	flotar32
pasos/observación/velocidad	Tensor	(9,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/walker_walk_combined_challenge_none_20_percent

Tamaño del conjunto de datos : 125.37 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :

Separar	Ejemplos
`'train'`	1,000

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(6,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/altura	Tensor	(1,)	flotar32
pasos/observación/orientaciones	Tensor	(14,)	flotar32
pasos/observación/velocidad	Tensor	(9,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/walker_walk_combined_challenge_none_40_percent

Tamaño del conjunto de datos : 250.75 MiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :

Separar	Ejemplos
`'train'`	2,000

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(6,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/altura	Tensor	(1,)	flotar32
pasos/observación/orientaciones	Tensor	(14,)	flotar32
pasos/observación/velocidad	Tensor	(9,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/walker_walk_combined_challenge_none_100_percent

Tamaño del conjunto de datos : 626.86 MiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :

Separar	Ejemplos
`'train'`	5,000

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(6,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/altura	Tensor	(1,)	flotar32
pasos/observación/orientaciones	Tensor	(14,)	flotar32
pasos/observación/velocidad	Tensor	(9,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/humanoid_walk_combined_challenge_none_1_percent

Tamaño del conjunto de datos : 69.40 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :

Separar	Ejemplos
`'train'`	200

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(21,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/com_velocidad	Tensor	(3,)	flotar32
pasos/observación/extremidades	Tensor	(12,)	flotar32
pasos/observación/cabeza_altura	Tensor	(1,)	flotar32
pasos/observación/joint_angles	Tensor	(21,)	flotar32
pasos/observación/torso_vertical	Tensor	(3,)	flotar32
pasos/observación/velocidad	Tensor	(27,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/humanoid_walk_combined_challenge_none_5_percent

Tamaño del conjunto de datos : 346.98 MiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :

Separar	Ejemplos
`'train'`	1,000

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(21,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/com_velocidad	Tensor	(3,)	flotar32
pasos/observación/extremidades	Tensor	(12,)	flotar32
pasos/observación/cabeza_altura	Tensor	(1,)	flotar32
pasos/observación/joint_angles	Tensor	(21,)	flotar32
pasos/observación/torso_vertical	Tensor	(3,)	flotar32
pasos/observación/velocidad	Tensor	(27,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/humanoid_walk_combined_challenge_none_20_percent

Tamaño del conjunto de datos : 1.36 GiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :

Separar	Ejemplos
`'train'`	4,000

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(21,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/com_velocidad	Tensor	(3,)	flotar32
pasos/observación/extremidades	Tensor	(12,)	flotar32
pasos/observación/cabeza_altura	Tensor	(1,)	flotar32
pasos/observación/joint_angles	Tensor	(21,)	flotar32
pasos/observación/torso_vertical	Tensor	(3,)	flotar32
pasos/observación/velocidad	Tensor	(27,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/humanoid_walk_combined_challenge_none_40_percent

Tamaño del conjunto de datos : 2.71 GiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :

Separar	Ejemplos
`'train'`	8,000

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(21,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/com_velocidad	Tensor	(3,)	flotar32
pasos/observación/extremidades	Tensor	(12,)	flotar32
pasos/observación/cabeza_altura	Tensor	(1,)	flotar32
pasos/observación/joint_angles	Tensor	(21,)	flotar32
pasos/observación/torso_vertical	Tensor	(3,)	flotar32
pasos/observación/velocidad	Tensor	(27,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/humanoid_walk_combined_challenge_none_100_percent

Tamaño del conjunto de datos : 6.78 GiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :

Separar	Ejemplos
`'train'`	20,000

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(21,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/com_velocidad	Tensor	(3,)	flotar32
pasos/observación/extremidades	Tensor	(12,)	flotar32
pasos/observación/cabeza_altura	Tensor	(1,)	flotar32
pasos/observación/joint_angles	Tensor	(21,)	flotar32
pasos/observación/torso_vertical	Tensor	(3,)	flotar32
pasos/observación/velocidad	Tensor	(27,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/cartpole_swingup_combined_challenge_easy_1_percent

Tamaño del conjunto de datos : 369.84 KiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :

Separar	Ejemplos
`'train'`	5

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(1,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/dummy-0	Tensor	(1,)	flotar32
pasos/observación/dummy-1	Tensor	(1,)	flotar32
pasos/observación/dummy-2	Tensor	(1,)	flotar32
pasos/observación/dummy-3	Tensor	(1,)	flotar32
pasos/observación/dummy-4	Tensor	(1,)	flotar32
pasos/observación/dummy-5	Tensor	(1,)	flotar32
pasos/observación/dummy-6	Tensor	(1,)	flotar32
pasos/observación/dummy-7	Tensor	(1,)	flotar32
pasos/observación/ficticio-8	Tensor	(1,)	flotar32
pasos/observación/ficticio-9	Tensor	(1,)	flotar32
pasos/observación/posición	Tensor	(3,)	flotar32
pasos/observación/velocidad	Tensor	(2,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/cartpole_swingup_combined_challenge_easy_5_percent

Tamaño del conjunto de datos : 1.81 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :

Separar	Ejemplos
`'train'`	25

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(1,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/dummy-0	Tensor	(1,)	flotar32
pasos/observación/dummy-1	Tensor	(1,)	flotar32
pasos/observación/dummy-2	Tensor	(1,)	flotar32
pasos/observación/dummy-3	Tensor	(1,)	flotar32
pasos/observación/dummy-4	Tensor	(1,)	flotar32
pasos/observación/dummy-5	Tensor	(1,)	flotar32
pasos/observación/dummy-6	Tensor	(1,)	flotar32
pasos/observación/dummy-7	Tensor	(1,)	flotar32
pasos/observación/ficticio-8	Tensor	(1,)	flotar32
pasos/observación/ficticio-9	Tensor	(1,)	flotar32
pasos/observación/posición	Tensor	(3,)	flotar32
pasos/observación/velocidad	Tensor	(2,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/cartpole_swingup_combined_challenge_easy_20_percent

Tamaño del conjunto de datos : 7.22 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :

Separar	Ejemplos
`'train'`	100

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(1,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/dummy-0	Tensor	(1,)	flotar32
pasos/observación/dummy-1	Tensor	(1,)	flotar32
pasos/observación/dummy-2	Tensor	(1,)	flotar32
pasos/observación/dummy-3	Tensor	(1,)	flotar32
pasos/observación/dummy-4	Tensor	(1,)	flotar32
pasos/observación/dummy-5	Tensor	(1,)	flotar32
pasos/observación/dummy-6	Tensor	(1,)	flotar32
pasos/observación/dummy-7	Tensor	(1,)	flotar32
pasos/observación/ficticio-8	Tensor	(1,)	flotar32
pasos/observación/ficticio-9	Tensor	(1,)	flotar32
pasos/observación/posición	Tensor	(3,)	flotar32
pasos/observación/velocidad	Tensor	(2,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/cartpole_swingup_combined_challenge_easy_40_percent

Tamaño del conjunto de datos : 14.45 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :

Separar	Ejemplos
`'train'`	200

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(1,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/dummy-0	Tensor	(1,)	flotar32
pasos/observación/dummy-1	Tensor	(1,)	flotar32
pasos/observación/dummy-2	Tensor	(1,)	flotar32
pasos/observación/dummy-3	Tensor	(1,)	flotar32
pasos/observación/dummy-4	Tensor	(1,)	flotar32
pasos/observación/dummy-5	Tensor	(1,)	flotar32
pasos/observación/dummy-6	Tensor	(1,)	flotar32
pasos/observación/dummy-7	Tensor	(1,)	flotar32
pasos/observación/ficticio-8	Tensor	(1,)	flotar32
pasos/observación/ficticio-9	Tensor	(1,)	flotar32
pasos/observación/posición	Tensor	(3,)	flotar32
pasos/observación/velocidad	Tensor	(2,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/cartpole_swingup_combined_challenge_easy_100_percent

Tamaño del conjunto de datos : 36.12 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :

Separar	Ejemplos
`'train'`	500

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(1,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/dummy-0	Tensor	(1,)	flotar32
pasos/observación/dummy-1	Tensor	(1,)	flotar32
pasos/observación/dummy-2	Tensor	(1,)	flotar32
pasos/observación/dummy-3	Tensor	(1,)	flotar32
pasos/observación/dummy-4	Tensor	(1,)	flotar32
pasos/observación/dummy-5	Tensor	(1,)	flotar32
pasos/observación/dummy-6	Tensor	(1,)	flotar32
pasos/observación/dummy-7	Tensor	(1,)	flotar32
pasos/observación/ficticio-8	Tensor	(1,)	flotar32
pasos/observación/ficticio-9	Tensor	(1,)	flotar32
pasos/observación/posición	Tensor	(3,)	flotar32
pasos/observación/velocidad	Tensor	(2,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/quadruped_walk_combined_challenge_easy_1_percent

Tamaño del conjunto de datos : 1.97 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :

Separar	Ejemplos
`'train'`	5

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(12,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/dummy-0	Tensor	(1,)	flotar32
pasos/observación/dummy-1	Tensor	(1,)	flotar32
pasos/observación/dummy-2	Tensor	(1,)	flotar32
pasos/observación/dummy-3	Tensor	(1,)	flotar32
pasos/observación/dummy-4	Tensor	(1,)	flotar32
pasos/observación/dummy-5	Tensor	(1,)	flotar32
pasos/observación/dummy-6	Tensor	(1,)	flotar32
pasos/observación/dummy-7	Tensor	(1,)	flotar32
pasos/observación/ficticio-8	Tensor	(1,)	flotar32
pasos/observación/ficticio-9	Tensor	(1,)	flotar32
pasos/observación/estado_egocéntrico	Tensor	(44,)	flotar32
pasos/observación/force_torque	Tensor	(24,)	flotar32
pasos/observación/imu	Tensor	(6,)	flotar32
pasos/observación/torso_vertical	Tensor	(1,)	flotar32
pasos/observación/torso_velocidad	Tensor	(3,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/quadruped_walk_combined_challenge_easy_5_percent

Tamaño del conjunto de datos : 9.83 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :

Separar	Ejemplos
`'train'`	25

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(12,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/dummy-0	Tensor	(1,)	flotar32
pasos/observación/dummy-1	Tensor	(1,)	flotar32
pasos/observación/dummy-2	Tensor	(1,)	flotar32
pasos/observación/dummy-3	Tensor	(1,)	flotar32
pasos/observación/dummy-4	Tensor	(1,)	flotar32
pasos/observación/dummy-5	Tensor	(1,)	flotar32
pasos/observación/dummy-6	Tensor	(1,)	flotar32
pasos/observación/dummy-7	Tensor	(1,)	flotar32
pasos/observación/ficticio-8	Tensor	(1,)	flotar32
pasos/observación/ficticio-9	Tensor	(1,)	flotar32
pasos/observación/estado_egocéntrico	Tensor	(44,)	flotar32
pasos/observación/force_torque	Tensor	(24,)	flotar32
pasos/observación/imu	Tensor	(6,)	flotar32
pasos/observación/torso_vertical	Tensor	(1,)	flotar32
pasos/observación/torso_velocidad	Tensor	(3,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/quadruped_walk_combined_challenge_easy_20_percent

Tamaño del conjunto de datos : 39.31 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :

Separar	Ejemplos
`'train'`	100

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(12,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/dummy-0	Tensor	(1,)	flotar32
pasos/observación/dummy-1	Tensor	(1,)	flotar32
pasos/observación/dummy-2	Tensor	(1,)	flotar32
pasos/observación/dummy-3	Tensor	(1,)	flotar32
pasos/observación/dummy-4	Tensor	(1,)	flotar32
pasos/observación/dummy-5	Tensor	(1,)	flotar32
pasos/observación/dummy-6	Tensor	(1,)	flotar32
pasos/observación/dummy-7	Tensor	(1,)	flotar32
pasos/observación/ficticio-8	Tensor	(1,)	flotar32
pasos/observación/ficticio-9	Tensor	(1,)	flotar32
pasos/observación/estado_egocéntrico	Tensor	(44,)	flotar32
pasos/observación/force_torque	Tensor	(24,)	flotar32
pasos/observación/imu	Tensor	(6,)	flotar32
pasos/observación/torso_vertical	Tensor	(1,)	flotar32
pasos/observación/torso_velocidad	Tensor	(3,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/quadruped_walk_combined_challenge_easy_40_percent

Tamaño del conjunto de datos : 78.63 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :

Separar	Ejemplos
`'train'`	200

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(12,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/dummy-0	Tensor	(1,)	flotar32
pasos/observación/dummy-1	Tensor	(1,)	flotar32
pasos/observación/dummy-2	Tensor	(1,)	flotar32
pasos/observación/dummy-3	Tensor	(1,)	flotar32
pasos/observación/dummy-4	Tensor	(1,)	flotar32
pasos/observación/dummy-5	Tensor	(1,)	flotar32
pasos/observación/dummy-6	Tensor	(1,)	flotar32
pasos/observación/dummy-7	Tensor	(1,)	flotar32
pasos/observación/ficticio-8	Tensor	(1,)	flotar32
pasos/observación/ficticio-9	Tensor	(1,)	flotar32
pasos/observación/estado_egocéntrico	Tensor	(44,)	flotar32
pasos/observación/force_torque	Tensor	(24,)	flotar32
pasos/observación/imu	Tensor	(6,)	flotar32
pasos/observación/torso_vertical	Tensor	(1,)	flotar32
pasos/observación/torso_velocidad	Tensor	(3,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/quadruped_walk_combined_challenge_easy_100_percent

Tamaño del conjunto de datos : 196.57 MiB
Auto-caché ( documentación ): Solo cuando shuffle_files=False (tren)
Divisiones :

Separar	Ejemplos
`'train'`	500

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(12,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/dummy-0	Tensor	(1,)	flotar32
pasos/observación/dummy-1	Tensor	(1,)	flotar32
pasos/observación/dummy-2	Tensor	(1,)	flotar32
pasos/observación/dummy-3	Tensor	(1,)	flotar32
pasos/observación/dummy-4	Tensor	(1,)	flotar32
pasos/observación/dummy-5	Tensor	(1,)	flotar32
pasos/observación/dummy-6	Tensor	(1,)	flotar32
pasos/observación/dummy-7	Tensor	(1,)	flotar32
pasos/observación/ficticio-8	Tensor	(1,)	flotar32
pasos/observación/ficticio-9	Tensor	(1,)	flotar32
pasos/observación/estado_egocéntrico	Tensor	(44,)	flotar32
pasos/observación/force_torque	Tensor	(24,)	flotar32
pasos/observación/imu	Tensor	(6,)	flotar32
pasos/observación/torso_vertical	Tensor	(1,)	flotar32
pasos/observación/torso_velocidad	Tensor	(3,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/walker_walk_combined_challenge_easy_1_percent

Tamaño del conjunto de datos : 8.20 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :

Separar	Ejemplos
`'train'`	50

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(6,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/dummy-0	Tensor	(1,)	flotar32
pasos/observación/dummy-1	Tensor	(1,)	flotar32
pasos/observación/dummy-2	Tensor	(1,)	flotar32
pasos/observación/dummy-3	Tensor	(1,)	flotar32
pasos/observación/dummy-4	Tensor	(1,)	flotar32
pasos/observación/dummy-5	Tensor	(1,)	flotar32
pasos/observación/dummy-6	Tensor	(1,)	flotar32
pasos/observación/dummy-7	Tensor	(1,)	flotar32
pasos/observación/ficticio-8	Tensor	(1,)	flotar32
pasos/observación/ficticio-9	Tensor	(1,)	flotar32
pasos/observación/altura	Tensor	(1,)	flotar32
pasos/observación/orientaciones	Tensor	(14,)	flotar32
pasos/observación/velocidad	Tensor	(9,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/walker_walk_combined_challenge_easy_5_percent

Tamaño del conjunto de datos : 40.98 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :

Separar	Ejemplos
`'train'`	250

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(6,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/dummy-0	Tensor	(1,)	flotar32
pasos/observación/dummy-1	Tensor	(1,)	flotar32
pasos/observación/dummy-2	Tensor	(1,)	flotar32
pasos/observación/dummy-3	Tensor	(1,)	flotar32
pasos/observación/dummy-4	Tensor	(1,)	flotar32
pasos/observación/dummy-5	Tensor	(1,)	flotar32
pasos/observación/dummy-6	Tensor	(1,)	flotar32
pasos/observación/dummy-7	Tensor	(1,)	flotar32
pasos/observación/ficticio-8	Tensor	(1,)	flotar32
pasos/observación/ficticio-9	Tensor	(1,)	flotar32
pasos/observación/altura	Tensor	(1,)	flotar32
pasos/observación/orientaciones	Tensor	(14,)	flotar32
pasos/observación/velocidad	Tensor	(9,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/walker_walk_combined_challenge_easy_20_percent

Tamaño del conjunto de datos : 163.93 MiB
Auto-caché ( documentación ): Solo cuando shuffle_files=False (tren)
Divisiones :

Separar	Ejemplos
`'train'`	1,000

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(6,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/dummy-0	Tensor	(1,)	flotar32
pasos/observación/dummy-1	Tensor	(1,)	flotar32
pasos/observación/dummy-2	Tensor	(1,)	flotar32
pasos/observación/dummy-3	Tensor	(1,)	flotar32
pasos/observación/dummy-4	Tensor	(1,)	flotar32
pasos/observación/dummy-5	Tensor	(1,)	flotar32
pasos/observación/dummy-6	Tensor	(1,)	flotar32
pasos/observación/dummy-7	Tensor	(1,)	flotar32
pasos/observación/ficticio-8	Tensor	(1,)	flotar32
pasos/observación/ficticio-9	Tensor	(1,)	flotar32
pasos/observación/altura	Tensor	(1,)	flotar32
pasos/observación/orientaciones	Tensor	(14,)	flotar32
pasos/observación/velocidad	Tensor	(9,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/walker_walk_combined_challenge_easy_40_percent

Tamaño del conjunto de datos : 327.86 MiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :

Separar	Ejemplos
`'train'`	2,000

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(6,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/dummy-0	Tensor	(1,)	flotar32
pasos/observación/dummy-1	Tensor	(1,)	flotar32
pasos/observación/dummy-2	Tensor	(1,)	flotar32
pasos/observación/dummy-3	Tensor	(1,)	flotar32
pasos/observación/dummy-4	Tensor	(1,)	flotar32
pasos/observación/dummy-5	Tensor	(1,)	flotar32
pasos/observación/dummy-6	Tensor	(1,)	flotar32
pasos/observación/dummy-7	Tensor	(1,)	flotar32
pasos/observación/ficticio-8	Tensor	(1,)	flotar32
pasos/observación/ficticio-9	Tensor	(1,)	flotar32
pasos/observación/altura	Tensor	(1,)	flotar32
pasos/observación/orientaciones	Tensor	(14,)	flotar32
pasos/observación/velocidad	Tensor	(9,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/walker_walk_combined_challenge_easy_100_percent

Tamaño del conjunto de datos : 819.65 MiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :

Separar	Ejemplos
`'train'`	5,000

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(6,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/dummy-0	Tensor	(1,)	flotar32
pasos/observación/dummy-1	Tensor	(1,)	flotar32
pasos/observación/dummy-2	Tensor	(1,)	flotar32
pasos/observación/dummy-3	Tensor	(1,)	flotar32
pasos/observación/dummy-4	Tensor	(1,)	flotar32
pasos/observación/dummy-5	Tensor	(1,)	flotar32
pasos/observación/dummy-6	Tensor	(1,)	flotar32
pasos/observación/dummy-7	Tensor	(1,)	flotar32
pasos/observación/ficticio-8	Tensor	(1,)	flotar32
pasos/observación/ficticio-9	Tensor	(1,)	flotar32
pasos/observación/altura	Tensor	(1,)	flotar32
pasos/observación/orientaciones	Tensor	(14,)	flotar32
pasos/observación/velocidad	Tensor	(9,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/humanoid_walk_combined_challenge_easy_1_percent

Tamaño del conjunto de datos : 77.11 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :

Separar	Ejemplos
`'train'`	200

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(21,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/com_velocidad	Tensor	(3,)	flotar32
pasos/observación/dummy-0	Tensor	(1,)	flotar32
pasos/observación/dummy-1	Tensor	(1,)	flotar32
pasos/observación/dummy-2	Tensor	(1,)	flotar32
pasos/observación/dummy-3	Tensor	(1,)	flotar32
pasos/observación/dummy-4	Tensor	(1,)	flotar32
pasos/observación/dummy-5	Tensor	(1,)	flotar32
pasos/observación/dummy-6	Tensor	(1,)	flotar32
pasos/observación/dummy-7	Tensor	(1,)	flotar32
pasos/observación/ficticio-8	Tensor	(1,)	flotar32
pasos/observación/ficticio-9	Tensor	(1,)	flotar32
pasos/observación/extremidades	Tensor	(12,)	flotar32
pasos/observación/cabeza_altura	Tensor	(1,)	flotar32
pasos/observación/joint_angles	Tensor	(21,)	flotar32
pasos/observación/torso_vertical	Tensor	(3,)	flotar32
pasos/observación/velocidad	Tensor	(27,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/humanoid_walk_combined_challenge_easy_5_percent

Tamaño del conjunto de datos : 385.54 MiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :

Separar	Ejemplos
`'train'`	1,000

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(21,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/com_velocidad	Tensor	(3,)	flotar32
pasos/observación/dummy-0	Tensor	(1,)	flotar32
pasos/observación/dummy-1	Tensor	(1,)	flotar32
pasos/observación/dummy-2	Tensor	(1,)	flotar32
pasos/observación/dummy-3	Tensor	(1,)	flotar32
pasos/observación/dummy-4	Tensor	(1,)	flotar32
pasos/observación/dummy-5	Tensor	(1,)	flotar32
pasos/observación/dummy-6	Tensor	(1,)	flotar32
pasos/observación/dummy-7	Tensor	(1,)	flotar32
pasos/observación/ficticio-8	Tensor	(1,)	flotar32
pasos/observación/ficticio-9	Tensor	(1,)	flotar32
pasos/observación/extremidades	Tensor	(12,)	flotar32
pasos/observación/cabeza_altura	Tensor	(1,)	flotar32
pasos/observación/joint_angles	Tensor	(21,)	flotar32
pasos/observación/torso_vertical	Tensor	(3,)	flotar32
pasos/observación/velocidad	Tensor	(27,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/humanoid_walk_combined_challenge_easy_20_percent

Tamaño del conjunto de datos : 1.51 GiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :

Separar	Ejemplos
`'train'`	4,000

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(21,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/com_velocidad	Tensor	(3,)	flotar32
pasos/observación/dummy-0	Tensor	(1,)	flotar32
pasos/observación/dummy-1	Tensor	(1,)	flotar32
pasos/observación/dummy-2	Tensor	(1,)	flotar32
pasos/observación/dummy-3	Tensor	(1,)	flotar32
pasos/observación/dummy-4	Tensor	(1,)	flotar32
pasos/observación/dummy-5	Tensor	(1,)	flotar32
pasos/observación/dummy-6	Tensor	(1,)	flotar32
pasos/observación/dummy-7	Tensor	(1,)	flotar32
pasos/observación/ficticio-8	Tensor	(1,)	flotar32
pasos/observación/ficticio-9	Tensor	(1,)	flotar32
pasos/observación/extremidades	Tensor	(12,)	flotar32
pasos/observación/cabeza_altura	Tensor	(1,)	flotar32
pasos/observación/joint_angles	Tensor	(21,)	flotar32
pasos/observación/torso_vertical	Tensor	(3,)	flotar32
pasos/observación/velocidad	Tensor	(27,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/humanoid_walk_combined_challenge_easy_40_percent

Tamaño del conjunto de datos : 3.01 GiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :

Separar	Ejemplos
`'train'`	8,000

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(21,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/com_velocidad	Tensor	(3,)	flotar32
pasos/observación/dummy-0	Tensor	(1,)	flotar32
pasos/observación/dummy-1	Tensor	(1,)	flotar32
pasos/observación/dummy-2	Tensor	(1,)	flotar32
pasos/observación/dummy-3	Tensor	(1,)	flotar32
pasos/observación/dummy-4	Tensor	(1,)	flotar32
pasos/observación/dummy-5	Tensor	(1,)	flotar32
pasos/observación/dummy-6	Tensor	(1,)	flotar32
pasos/observación/dummy-7	Tensor	(1,)	flotar32
pasos/observación/ficticio-8	Tensor	(1,)	flotar32
pasos/observación/ficticio-9	Tensor	(1,)	flotar32
pasos/observación/extremidades	Tensor	(12,)	flotar32
pasos/observación/cabeza_altura	Tensor	(1,)	flotar32
pasos/observación/joint_angles	Tensor	(21,)	flotar32
pasos/observación/torso_vertical	Tensor	(3,)	flotar32
pasos/observación/velocidad	Tensor	(27,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):

rlu_rwrl/humanoid_walk_combined_challenge_easy_100_percent

Tamaño del conjunto de datos : 7.53 GiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :

Separar	Ejemplos
`'train'`	20,000

Estructura de características :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Documentación de características :

Rasgo	Clase	Forma	Tipo D
	CaracterísticasDict
episodio_retorno	Tensor		flotar32
pasos	conjunto de datos
pasos/acción	Tensor	(21,)	flotar32
pasos/descuento	Tensor	(1,)	flotar32
pasos/es_primero	Tensor		bool
pasos/es_último	Tensor		bool
pasos/es_terminal	Tensor		bool
pasos/observación	CaracterísticasDict
pasos/observación/com_velocidad	Tensor	(3,)	flotar32
pasos/observación/dummy-0	Tensor	(1,)	flotar32
pasos/observación/dummy-1	Tensor	(1,)	flotar32
pasos/observación/dummy-2	Tensor	(1,)	flotar32
pasos/observación/dummy-3	Tensor	(1,)	flotar32
pasos/observación/dummy-4	Tensor	(1,)	flotar32
pasos/observación/dummy-5	Tensor	(1,)	flotar32
pasos/observación/dummy-6	Tensor	(1,)	flotar32
pasos/observación/dummy-7	Tensor	(1,)	flotar32
pasos/observación/ficticio-8	Tensor	(1,)	flotar32
pasos/observación/ficticio-9	Tensor	(1,)	flotar32
pasos/observación/extremidades	Tensor	(12,)	flotar32
pasos/observación/cabeza_altura	Tensor	(1,)	flotar32
pasos/observación/joint_angles	Tensor	(21,)	flotar32
pasos/observación/torso_vertical	Tensor	(3,)	flotar32
pasos/observación/velocidad	Tensor	(27,)	flotar32
pasos/recompensa	Tensor	(1,)	flotar32

Ejemplos ( tfds.as_dataframe ):