rlu_rwrl

  • Descriptif :

RL Unplugged est une suite de références pour l'apprentissage par renforcement hors ligne. Le RL Unplugged est conçu autour des considérations suivantes : pour faciliter l'utilisation, nous fournissons les ensembles de données avec une API unifiée qui permet au praticien de travailler facilement avec toutes les données de la suite une fois qu'un pipeline général a été établi.

Les ensembles de données suivent le format RLDS pour représenter les étapes et les épisodes.

Les exemples dans l'ensemble de données représentent les transitions SAR stockées lors de l'exécution d'un agent formé partiellement en ligne, comme décrit dans https://arxiv.org/abs/1904.12901 Nous suivons le format d'ensemble de données RLDS, comme spécifié dans https://github.com/google-research /rlds#format-ensemble-de-données

Nous publions 40 ensembles de données sur 8 tâches au total - sans défi combiné et défi combiné facile sur les tâches cartpole, marcheur, quadrupède et humanoïde. Chaque tâche contient 5 tailles différentes d'ensembles de données, 1 %, 5 %, 20 %, 40 % et 100 %. Notez qu'il n'est pas garanti que le plus petit ensemble de données soit un sous-ensemble des plus grands. Pour plus de détails sur la façon dont l'ensemble de données a été généré, veuillez vous reporter à l'article.

@misc{gulcehre2020rl,
    title={RL Unplugged: Benchmarks for Offline Reinforcement Learning},
    author={Caglar Gulcehre and Ziyu Wang and Alexander Novikov and Tom Le Paine
        and  Sergio Gómez Colmenarejo and Konrad Zolna and Rishabh Agarwal and
        Josh Merel and Daniel Mankowitz and Cosmin Paduraru and Gabriel
        Dulac-Arnold and Jerry Li and Mohammad Norouzi and Matt Hoffman and
        Ofir Nachum and George Tucker and Nicolas Heess and Nando deFreitas},
    year={2020},
    eprint={2006.13888},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

rlu_rwrl/cartpole_swingup_combined_challenge_none_1_percent (configuration par défaut)

  • Taille du jeu de données : 172.43 KiB

  • Mise en cache automatique ( documentation ): Oui

  • Fractionnements :

Diviser Exemples
'train' 5
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/action Tenseur (1,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
pas/observation/position Tenseur (3,) float32
pas/observation/vitesse Tenseur (2,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/cartpole_swingup_combined_challenge_none_5_percent

  • Taille du jeu de données : 862.13 KiB

  • Mise en cache automatique ( documentation ): Oui

  • Fractionnements :

Diviser Exemples
'train' 25
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/actions Tenseur (1,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
pas/observation/position Tenseur (3,) float32
pas/observation/vitesse Tenseur (2,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/cartpole_swingup_combined_challenge_none_20_percent

  • Taille du jeu de données : 3.37 MiB

  • Mise en cache automatique ( documentation ): Oui

  • Fractionnements :

Diviser Exemples
'train' 100
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/action Tenseur (1,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
pas/observation/position Tenseur (3,) float32
pas/observation/vitesse Tenseur (2,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/cartpole_swingup_combined_challenge_none_40_percent

  • Taille du jeu de données : 6.74 MiB

  • Mise en cache automatique ( documentation ): Oui

  • Fractionnements :

Diviser Exemples
'train' 200
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/action Tenseur (1,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
pas/observation/position Tenseur (3,) float32
pas/observation/vitesse Tenseur (2,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/cartpole_swingup_combined_challenge_none_100_percent

  • Taille du jeu de données : 16.84 MiB

  • Mise en cache automatique ( documentation ): Oui

  • Fractionnements :

Diviser Exemples
'train' 500
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/actions Tenseur (1,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
pas/observation/position Tenseur (3,) float32
pas/observation/vitesse Tenseur (2,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/quadruped_walk_combined_challenge_none_1_percent

  • Taille du jeu de données : 1.77 MiB

  • Mise en cache automatique ( documentation ): Oui

  • Fractionnements :

Diviser Exemples
'train' 5
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/actions Tenseur (12,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
étapes/observation/état_égocentrique Tenseur (44,) float32
étapes/observation/force_torque Tenseur (24,) float32
pas/observation/imu Tenseur (6,) float32
pas/observation/torse_debout Tenseur (1,) float32
pas/observation/torse_velocity Tenseur (3,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/quadruped_walk_combined_challenge_none_5_percent

  • Taille du jeu de données : 8.86 MiB

  • Mise en cache automatique ( documentation ): Oui

  • Fractionnements :

Diviser Exemples
'train' 25
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/action Tenseur (12,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
étapes/observation/état_égocentrique Tenseur (44,) float32
étapes/observation/force_torque Tenseur (24,) float32
pas/observation/imu Tenseur (6,) float32
pas/observation/torse_debout Tenseur (1,) float32
pas/observation/torse_velocity Tenseur (3,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/quadruped_walk_combined_challenge_none_20_percent

  • Taille du jeu de données : 35.46 MiB

  • Mise en cache automatique ( documentation ): Oui

  • Fractionnements :

Diviser Exemples
'train' 100
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/actions Tenseur (12,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
étapes/observation/état_égocentrique Tenseur (44,) float32
étapes/observation/force_torque Tenseur (24,) float32
pas/observation/imu Tenseur (6,) float32
pas/observation/torse_debout Tenseur (1,) float32
pas/observation/torse_velocity Tenseur (3,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/quadruped_walk_combined_challenge_none_40_percent

  • Taille du jeu de données : 70.92 MiB

  • Mise en cache automatique ( documentation ): Oui

  • Fractionnements :

Diviser Exemples
'train' 200
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/actions Tenseur (12,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
étapes/observation/état_égocentrique Tenseur (44,) float32
étapes/observation/force_torque Tenseur (24,) float32
pas/observation/imu Tenseur (6,) float32
pas/observation/torse_debout Tenseur (1,) float32
pas/observation/torse_velocity Tenseur (3,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/quadruped_walk_combined_challenge_none_100_percent

  • Taille du jeu de données : 177.29 MiB

  • Mise en cache automatique ( documentation ) : uniquement lorsque shuffle_files=False (train)

  • Fractionnements :

Diviser Exemples
'train' 500
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/actions Tenseur (12,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
étapes/observation/état_égocentrique Tenseur (44,) float32
étapes/observation/force_torque Tenseur (24,) float32
pas/observation/imu Tenseur (6,) float32
pas/observation/torse_debout Tenseur (1,) float32
pas/observation/torse_velocity Tenseur (3,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/walker_walk_combined_challenge_none_1_percent

  • Taille du jeu de données : 6.27 MiB

  • Mise en cache automatique ( documentation ): Oui

  • Fractionnements :

Diviser Exemples
'train' 50
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/actions Tenseur (6,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
marches/observation/hauteur Tenseur (1,) float32
étapes/observation/orientations Tenseur (14,) float32
pas/observation/vitesse Tenseur (9,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/walker_walk_combined_challenge_none_5_percent

  • Taille du jeu de données : 31.34 MiB

  • Mise en cache automatique ( documentation ): Oui

  • Fractionnements :

Diviser Exemples
'train' 250
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/actions Tenseur (6,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
marches/observation/hauteur Tenseur (1,) float32
étapes/observation/orientations Tenseur (14,) float32
pas/observation/vitesse Tenseur (9,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/walker_walk_combined_challenge_none_20_percent

  • Taille du jeu de données : 125.37 MiB

  • Mise en cache automatique ( documentation ): Oui

  • Fractionnements :

Diviser Exemples
'train' 1 000
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/action Tenseur (6,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
marches/observation/hauteur Tenseur (1,) float32
étapes/observation/orientations Tenseur (14,) float32
pas/observation/vitesse Tenseur (9,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/walker_walk_combined_challenge_none_40_percent

  • Taille du jeu de données : 250.75 MiB

  • Mise en cache automatique ( documentation ): Non

  • Fractionnements :

Diviser Exemples
'train' 2 000
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/actions Tenseur (6,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
marches/observation/hauteur Tenseur (1,) float32
étapes/observation/orientations Tenseur (14,) float32
pas/observation/vitesse Tenseur (9,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/walker_walk_combined_challenge_none_100_percent

  • Taille du jeu de données : 626.86 MiB

  • Mise en cache automatique ( documentation ): Non

  • Fractionnements :

Diviser Exemples
'train' 5 000
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/action Tenseur (6,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
marches/observation/hauteur Tenseur (1,) float32
étapes/observation/orientations Tenseur (14,) float32
pas/observation/vitesse Tenseur (9,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/humanoid_walk_combined_challenge_none_1_percent

  • Taille du jeu de données : 69.40 MiB

  • Mise en cache automatique ( documentation ): Oui

  • Fractionnements :

Diviser Exemples
'train' 200
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/action Tenseur (21,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
pas/observation/com_velocity Tenseur (3,) float32
pas/observation/extrémités Tenseur (12,) float32
pas/observation/head_height Tenseur (1,) float32
étapes/observation/joint_angles Tenseur (21,) float32
pas/observation/torse_vertical Tenseur (3,) float32
pas/observation/vitesse Tenseur (27,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/humanoid_walk_combined_challenge_none_5_percent

  • Taille du jeu de données : 346.98 MiB

  • Mise en cache automatique ( documentation ): Non

  • Fractionnements :

Diviser Exemples
'train' 1 000
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/action Tenseur (21,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
pas/observation/com_velocity Tenseur (3,) float32
pas/observation/extrémités Tenseur (12,) float32
pas/observation/head_height Tenseur (1,) float32
étapes/observation/joint_angles Tenseur (21,) float32
pas/observation/torse_vertical Tenseur (3,) float32
pas/observation/vitesse Tenseur (27,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/humanoid_walk_combined_challenge_none_20_percent

  • Taille du jeu de données : 1.36 GiB

  • Mise en cache automatique ( documentation ): Non

  • Fractionnements :

Diviser Exemples
'train' 4 000
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/actions Tenseur (21,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
pas/observation/com_velocity Tenseur (3,) float32
pas/observation/extrémités Tenseur (12,) float32
pas/observation/head_height Tenseur (1,) float32
étapes/observation/joint_angles Tenseur (21,) float32
pas/observation/torse_vertical Tenseur (3,) float32
pas/observation/vitesse Tenseur (27,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/humanoid_walk_combined_challenge_none_40_percent

  • Taille du jeu de données : 2.71 GiB

  • Mise en cache automatique ( documentation ): Non

  • Fractionnements :

Diviser Exemples
'train' 8 000
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/actions Tenseur (21,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
pas/observation/com_velocity Tenseur (3,) float32
pas/observation/extrémités Tenseur (12,) float32
pas/observation/head_height Tenseur (1,) float32
étapes/observation/joint_angles Tenseur (21,) float32
pas/observation/torse_vertical Tenseur (3,) float32
pas/observation/vitesse Tenseur (27,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/humanoid_walk_combined_challenge_none_100_percent

  • Taille du jeu de données : 6.78 GiB

  • Mise en cache automatique ( documentation ): Non

  • Fractionnements :

Diviser Exemples
'train' 20 000
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/actions Tenseur (21,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
pas/observation/com_velocity Tenseur (3,) float32
pas/observation/extrémités Tenseur (12,) float32
pas/observation/head_height Tenseur (1,) float32
étapes/observation/joint_angles Tenseur (21,) float32
pas/observation/torse_vertical Tenseur (3,) float32
pas/observation/vitesse Tenseur (27,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_1_percent

  • Taille du jeu de données : 369.84 KiB

  • Mise en cache automatique ( documentation ): Oui

  • Fractionnements :

Diviser Exemples
'train' 5
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/action Tenseur (1,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
pas/observation/mannequin-0 Tenseur (1,) float32
étapes/observation/mannequin-1 Tenseur (1,) float32
étapes/observation/mannequin-2 Tenseur (1,) float32
étapes/observation/mannequin-3 Tenseur (1,) float32
étapes/observation/mannequin-4 Tenseur (1,) float32
étapes/observation/mannequin-5 Tenseur (1,) float32
étapes/observation/mannequin-6 Tenseur (1,) float32
étapes/observation/mannequin-7 Tenseur (1,) float32
étapes/observation/mannequin-8 Tenseur (1,) float32
étapes/observation/mannequin-9 Tenseur (1,) float32
pas/observation/position Tenseur (3,) float32
pas/observation/vitesse Tenseur (2,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_5_percent

  • Taille du jeu de données : 1.81 MiB

  • Mise en cache automatique ( documentation ): Oui

  • Fractionnements :

Diviser Exemples
'train' 25
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/actions Tenseur (1,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
pas/observation/mannequin-0 Tenseur (1,) float32
étapes/observation/mannequin-1 Tenseur (1,) float32
étapes/observation/mannequin-2 Tenseur (1,) float32
étapes/observation/mannequin-3 Tenseur (1,) float32
étapes/observation/mannequin-4 Tenseur (1,) float32
étapes/observation/mannequin-5 Tenseur (1,) float32
étapes/observation/mannequin-6 Tenseur (1,) float32
étapes/observation/mannequin-7 Tenseur (1,) float32
étapes/observation/mannequin-8 Tenseur (1,) float32
étapes/observation/mannequin-9 Tenseur (1,) float32
pas/observation/position Tenseur (3,) float32
pas/observation/vitesse Tenseur (2,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_20_percent

  • Taille du jeu de données : 7.22 MiB

  • Mise en cache automatique ( documentation ): Oui

  • Fractionnements :

Diviser Exemples
'train' 100
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/actions Tenseur (1,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
pas/observation/mannequin-0 Tenseur (1,) float32
étapes/observation/mannequin-1 Tenseur (1,) float32
étapes/observation/mannequin-2 Tenseur (1,) float32
étapes/observation/mannequin-3 Tenseur (1,) float32
étapes/observation/mannequin-4 Tenseur (1,) float32
étapes/observation/mannequin-5 Tenseur (1,) float32
étapes/observation/mannequin-6 Tenseur (1,) float32
étapes/observation/mannequin-7 Tenseur (1,) float32
étapes/observation/mannequin-8 Tenseur (1,) float32
étapes/observation/mannequin-9 Tenseur (1,) float32
pas/observation/position Tenseur (3,) float32
pas/observation/vitesse Tenseur (2,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_40_percent

  • Taille du jeu de données : 14.45 MiB

  • Mise en cache automatique ( documentation ): Oui

  • Fractionnements :

Diviser Exemples
'train' 200
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/action Tenseur (1,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
pas/observation/mannequin-0 Tenseur (1,) float32
étapes/observation/mannequin-1 Tenseur (1,) float32
étapes/observation/mannequin-2 Tenseur (1,) float32
étapes/observation/mannequin-3 Tenseur (1,) float32
étapes/observation/mannequin-4 Tenseur (1,) float32
étapes/observation/mannequin-5 Tenseur (1,) float32
étapes/observation/mannequin-6 Tenseur (1,) float32
étapes/observation/mannequin-7 Tenseur (1,) float32
étapes/observation/mannequin-8 Tenseur (1,) float32
étapes/observation/mannequin-9 Tenseur (1,) float32
pas/observation/position Tenseur (3,) float32
pas/observation/vitesse Tenseur (2,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_100_percent

  • Taille du jeu de données : 36.12 MiB

  • Mise en cache automatique ( documentation ): Oui

  • Fractionnements :

Diviser Exemples
'train' 500
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/action Tenseur (1,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
pas/observation/mannequin-0 Tenseur (1,) float32
étapes/observation/mannequin-1 Tenseur (1,) float32
étapes/observation/mannequin-2 Tenseur (1,) float32
étapes/observation/mannequin-3 Tenseur (1,) float32
étapes/observation/mannequin-4 Tenseur (1,) float32
étapes/observation/mannequin-5 Tenseur (1,) float32
étapes/observation/mannequin-6 Tenseur (1,) float32
étapes/observation/mannequin-7 Tenseur (1,) float32
étapes/observation/mannequin-8 Tenseur (1,) float32
étapes/observation/mannequin-9 Tenseur (1,) float32
pas/observation/position Tenseur (3,) float32
pas/observation/vitesse Tenseur (2,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/quadruped_walk_combined_challenge_easy_1_percent

  • Taille du jeu de données : 1.97 MiB

  • Mise en cache automatique ( documentation ): Oui

  • Fractionnements :

Diviser Exemples
'train' 5
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/action Tenseur (12,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
pas/observation/mannequin-0 Tenseur (1,) float32
étapes/observation/mannequin-1 Tenseur (1,) float32
étapes/observation/mannequin-2 Tenseur (1,) float32
étapes/observation/mannequin-3 Tenseur (1,) float32
étapes/observation/mannequin-4 Tenseur (1,) float32
étapes/observation/mannequin-5 Tenseur (1,) float32
étapes/observation/mannequin-6 Tenseur (1,) float32
étapes/observation/mannequin-7 Tenseur (1,) float32
étapes/observation/mannequin-8 Tenseur (1,) float32
étapes/observation/mannequin-9 Tenseur (1,) float32
étapes/observation/état_égocentrique Tenseur (44,) float32
étapes/observation/force_torque Tenseur (24,) float32
pas/observation/imu Tenseur (6,) float32
pas/observation/torse_debout Tenseur (1,) float32
pas/observation/torse_velocity Tenseur (3,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/quadruped_walk_combined_challenge_easy_5_percent

  • Taille du jeu de données : 9.83 MiB

  • Mise en cache automatique ( documentation ): Oui

  • Fractionnements :

Diviser Exemples
'train' 25
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/action Tenseur (12,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
pas/observation/mannequin-0 Tenseur (1,) float32
étapes/observation/mannequin-1 Tenseur (1,) float32
étapes/observation/mannequin-2 Tenseur (1,) float32
étapes/observation/mannequin-3 Tenseur (1,) float32
étapes/observation/mannequin-4 Tenseur (1,) float32
étapes/observation/mannequin-5 Tenseur (1,) float32
étapes/observation/mannequin-6 Tenseur (1,) float32
étapes/observation/mannequin-7 Tenseur (1,) float32
étapes/observation/mannequin-8 Tenseur (1,) float32
étapes/observation/mannequin-9 Tenseur (1,) float32
étapes/observation/état_égocentrique Tenseur (44,) float32
étapes/observation/force_torque Tenseur (24,) float32
pas/observation/imu Tenseur (6,) float32
pas/observation/torse_debout Tenseur (1,) float32
pas/observation/torse_velocity Tenseur (3,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/quadruped_walk_combined_challenge_easy_20_percent

  • Taille du jeu de données : 39.31 MiB

  • Mise en cache automatique ( documentation ): Oui

  • Fractionnements :

Diviser Exemples
'train' 100
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/action Tenseur (12,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
pas/observation/mannequin-0 Tenseur (1,) float32
étapes/observation/mannequin-1 Tenseur (1,) float32
étapes/observation/mannequin-2 Tenseur (1,) float32
étapes/observation/mannequin-3 Tenseur (1,) float32
étapes/observation/mannequin-4 Tenseur (1,) float32
étapes/observation/mannequin-5 Tenseur (1,) float32
étapes/observation/mannequin-6 Tenseur (1,) float32
étapes/observation/mannequin-7 Tenseur (1,) float32
étapes/observation/mannequin-8 Tenseur (1,) float32
étapes/observation/mannequin-9 Tenseur (1,) float32
étapes/observation/état_égocentrique Tenseur (44,) float32
étapes/observation/force_torque Tenseur (24,) float32
pas/observation/imu Tenseur (6,) float32
pas/observation/torse_debout Tenseur (1,) float32
pas/observation/torse_velocity Tenseur (3,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/quadruped_walk_combined_challenge_easy_40_percent

  • Taille du jeu de données : 78.63 MiB

  • Mise en cache automatique ( documentation ): Oui

  • Fractionnements :

Diviser Exemples
'train' 200
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/action Tenseur (12,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
pas/observation/mannequin-0 Tenseur (1,) float32
étapes/observation/mannequin-1 Tenseur (1,) float32
étapes/observation/mannequin-2 Tenseur (1,) float32
étapes/observation/mannequin-3 Tenseur (1,) float32
étapes/observation/mannequin-4 Tenseur (1,) float32
étapes/observation/mannequin-5 Tenseur (1,) float32
étapes/observation/mannequin-6 Tenseur (1,) float32
étapes/observation/mannequin-7 Tenseur (1,) float32
étapes/observation/mannequin-8 Tenseur (1,) float32
étapes/observation/mannequin-9 Tenseur (1,) float32
étapes/observation/état_égocentrique Tenseur (44,) float32
étapes/observation/force_torque Tenseur (24,) float32
pas/observation/imu Tenseur (6,) float32
pas/observation/torse_debout Tenseur (1,) float32
pas/observation/torse_velocity Tenseur (3,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/quadruped_walk_combined_challenge_easy_100_percent

  • Taille du jeu de données : 196.57 MiB

  • Mise en cache automatique ( documentation ) : uniquement lorsque shuffle_files=False (train)

  • Fractionnements :

Diviser Exemples
'train' 500
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/action Tenseur (12,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
pas/observation/mannequin-0 Tenseur (1,) float32
étapes/observation/mannequin-1 Tenseur (1,) float32
étapes/observation/mannequin-2 Tenseur (1,) float32
étapes/observation/mannequin-3 Tenseur (1,) float32
étapes/observation/mannequin-4 Tenseur (1,) float32
étapes/observation/mannequin-5 Tenseur (1,) float32
étapes/observation/mannequin-6 Tenseur (1,) float32
étapes/observation/mannequin-7 Tenseur (1,) float32
étapes/observation/mannequin-8 Tenseur (1,) float32
étapes/observation/mannequin-9 Tenseur (1,) float32
étapes/observation/état_égocentrique Tenseur (44,) float32
étapes/observation/force_torque Tenseur (24,) float32
pas/observation/imu Tenseur (6,) float32
pas/observation/torse_debout Tenseur (1,) float32
pas/observation/torse_velocity Tenseur (3,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/walker_walk_combined_challenge_easy_1_percent

  • Taille du jeu de données : 8.20 MiB

  • Mise en cache automatique ( documentation ): Oui

  • Fractionnements :

Diviser Exemples
'train' 50
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/action Tenseur (6,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
pas/observation/mannequin-0 Tenseur (1,) float32
étapes/observation/mannequin-1 Tenseur (1,) float32
étapes/observation/mannequin-2 Tenseur (1,) float32
étapes/observation/mannequin-3 Tenseur (1,) float32
étapes/observation/mannequin-4 Tenseur (1,) float32
étapes/observation/mannequin-5 Tenseur (1,) float32
étapes/observation/mannequin-6 Tenseur (1,) float32
étapes/observation/mannequin-7 Tenseur (1,) float32
étapes/observation/mannequin-8 Tenseur (1,) float32
étapes/observation/mannequin-9 Tenseur (1,) float32
marches/observation/hauteur Tenseur (1,) float32
étapes/observation/orientations Tenseur (14,) float32
pas/observation/vitesse Tenseur (9,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/walker_walk_combined_challenge_easy_5_percent

  • Taille du jeu de données : 40.98 MiB

  • Mise en cache automatique ( documentation ): Oui

  • Fractionnements :

Diviser Exemples
'train' 250
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/action Tenseur (6,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
pas/observation/mannequin-0 Tenseur (1,) float32
étapes/observation/mannequin-1 Tenseur (1,) float32
étapes/observation/mannequin-2 Tenseur (1,) float32
étapes/observation/mannequin-3 Tenseur (1,) float32
étapes/observation/mannequin-4 Tenseur (1,) float32
étapes/observation/mannequin-5 Tenseur (1,) float32
étapes/observation/mannequin-6 Tenseur (1,) float32
étapes/observation/mannequin-7 Tenseur (1,) float32
étapes/observation/mannequin-8 Tenseur (1,) float32
étapes/observation/mannequin-9 Tenseur (1,) float32
marches/observation/hauteur Tenseur (1,) float32
étapes/observation/orientations Tenseur (14,) float32
pas/observation/vitesse Tenseur (9,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/walker_walk_combined_challenge_easy_20_percent

  • Taille du jeu de données : 163.93 MiB

  • Mise en cache automatique ( documentation ) : uniquement lorsque shuffle_files=False (train)

  • Fractionnements :

Diviser Exemples
'train' 1 000
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/actions Tenseur (6,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
pas/observation/mannequin-0 Tenseur (1,) float32
étapes/observation/mannequin-1 Tenseur (1,) float32
étapes/observation/mannequin-2 Tenseur (1,) float32
étapes/observation/mannequin-3 Tenseur (1,) float32
étapes/observation/mannequin-4 Tenseur (1,) float32
étapes/observation/mannequin-5 Tenseur (1,) float32
étapes/observation/mannequin-6 Tenseur (1,) float32
étapes/observation/mannequin-7 Tenseur (1,) float32
étapes/observation/mannequin-8 Tenseur (1,) float32
étapes/observation/mannequin-9 Tenseur (1,) float32
marches/observation/hauteur Tenseur (1,) float32
étapes/observation/orientations Tenseur (14,) float32
pas/observation/vitesse Tenseur (9,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/walker_walk_combined_challenge_easy_40_percent

  • Taille du jeu de données : 327.86 MiB

  • Mise en cache automatique ( documentation ): Non

  • Fractionnements :

Diviser Exemples
'train' 2 000
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/action Tenseur (6,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
pas/observation/mannequin-0 Tenseur (1,) float32
étapes/observation/mannequin-1 Tenseur (1,) float32
étapes/observation/mannequin-2 Tenseur (1,) float32
étapes/observation/mannequin-3 Tenseur (1,) float32
étapes/observation/mannequin-4 Tenseur (1,) float32
étapes/observation/mannequin-5 Tenseur (1,) float32
étapes/observation/mannequin-6 Tenseur (1,) float32
étapes/observation/mannequin-7 Tenseur (1,) float32
étapes/observation/mannequin-8 Tenseur (1,) float32
étapes/observation/mannequin-9 Tenseur (1,) float32
marches/observation/hauteur Tenseur (1,) float32
étapes/observation/orientations Tenseur (14,) float32
pas/observation/vitesse Tenseur (9,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/walker_walk_combined_challenge_easy_100_percent

  • Taille du jeu de données : 819.65 MiB

  • Mise en cache automatique ( documentation ): Non

  • Fractionnements :

Diviser Exemples
'train' 5 000
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/action Tenseur (6,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
pas/observation/mannequin-0 Tenseur (1,) float32
étapes/observation/mannequin-1 Tenseur (1,) float32
étapes/observation/mannequin-2 Tenseur (1,) float32
étapes/observation/mannequin-3 Tenseur (1,) float32
étapes/observation/mannequin-4 Tenseur (1,) float32
étapes/observation/mannequin-5 Tenseur (1,) float32
étapes/observation/mannequin-6 Tenseur (1,) float32
étapes/observation/mannequin-7 Tenseur (1,) float32
étapes/observation/mannequin-8 Tenseur (1,) float32
étapes/observation/mannequin-9 Tenseur (1,) float32
marches/observation/hauteur Tenseur (1,) float32
étapes/observation/orientations Tenseur (14,) float32
pas/observation/vitesse Tenseur (9,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/humanoid_walk_combined_challenge_easy_1_percent

  • Taille du jeu de données : 77.11 MiB

  • Mise en cache automatique ( documentation ): Oui

  • Fractionnements :

Diviser Exemples
'train' 200
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/action Tenseur (21,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
pas/observation/com_velocity Tenseur (3,) float32
pas/observation/mannequin-0 Tenseur (1,) float32
étapes/observation/mannequin-1 Tenseur (1,) float32
étapes/observation/mannequin-2 Tenseur (1,) float32
étapes/observation/mannequin-3 Tenseur (1,) float32
étapes/observation/mannequin-4 Tenseur (1,) float32
étapes/observation/mannequin-5 Tenseur (1,) float32
étapes/observation/mannequin-6 Tenseur (1,) float32
étapes/observation/mannequin-7 Tenseur (1,) float32
étapes/observation/mannequin-8 Tenseur (1,) float32
étapes/observation/mannequin-9 Tenseur (1,) float32
pas/observation/extrémités Tenseur (12,) float32
pas/observation/head_height Tenseur (1,) float32
étapes/observation/joint_angles Tenseur (21,) float32
pas/observation/torse_vertical Tenseur (3,) float32
pas/observation/vitesse Tenseur (27,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/humanoid_walk_combined_challenge_easy_5_percent

  • Taille du jeu de données : 385.54 MiB

  • Mise en cache automatique ( documentation ): Non

  • Fractionnements :

Diviser Exemples
'train' 1 000
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/action Tenseur (21,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
pas/observation/com_velocity Tenseur (3,) float32
pas/observation/mannequin-0 Tenseur (1,) float32
étapes/observation/mannequin-1 Tenseur (1,) float32
étapes/observation/mannequin-2 Tenseur (1,) float32
étapes/observation/mannequin-3 Tenseur (1,) float32
étapes/observation/mannequin-4 Tenseur (1,) float32
étapes/observation/mannequin-5 Tenseur (1,) float32
étapes/observation/mannequin-6 Tenseur (1,) float32
étapes/observation/mannequin-7 Tenseur (1,) float32
étapes/observation/mannequin-8 Tenseur (1,) float32
étapes/observation/mannequin-9 Tenseur (1,) float32
pas/observation/extrémités Tenseur (12,) float32
pas/observation/head_height Tenseur (1,) float32
étapes/observation/joint_angles Tenseur (21,) float32
pas/observation/torse_vertical Tenseur (3,) float32
pas/observation/vitesse Tenseur (27,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/humanoid_walk_combined_challenge_easy_20_percent

  • Taille du jeu de données : 1.51 GiB

  • Mise en cache automatique ( documentation ): Non

  • Fractionnements :

Diviser Exemples
'train' 4 000
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/action Tenseur (21,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
pas/observation/com_velocity Tenseur (3,) float32
pas/observation/mannequin-0 Tenseur (1,) float32
étapes/observation/mannequin-1 Tenseur (1,) float32
étapes/observation/mannequin-2 Tenseur (1,) float32
étapes/observation/mannequin-3 Tenseur (1,) float32
étapes/observation/mannequin-4 Tenseur (1,) float32
étapes/observation/mannequin-5 Tenseur (1,) float32
étapes/observation/mannequin-6 Tenseur (1,) float32
étapes/observation/mannequin-7 Tenseur (1,) float32
étapes/observation/mannequin-8 Tenseur (1,) float32
étapes/observation/mannequin-9 Tenseur (1,) float32
pas/observation/extrémités Tenseur (12,) float32
pas/observation/head_height Tenseur (1,) float32
étapes/observation/joint_angles Tenseur (21,) float32
pas/observation/torse_vertical Tenseur (3,) float32
pas/observation/vitesse Tenseur (27,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/humanoid_walk_combined_challenge_easy_40_percent

  • Taille du jeu de données : 3.01 GiB

  • Mise en cache automatique ( documentation ): Non

  • Fractionnements :

Diviser Exemples
'train' 8 000
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/actions Tenseur (21,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
pas/observation/com_velocity Tenseur (3,) float32
pas/observation/mannequin-0 Tenseur (1,) float32
étapes/observation/mannequin-1 Tenseur (1,) float32
étapes/observation/mannequin-2 Tenseur (1,) float32
étapes/observation/mannequin-3 Tenseur (1,) float32
étapes/observation/mannequin-4 Tenseur (1,) float32
étapes/observation/mannequin-5 Tenseur (1,) float32
étapes/observation/mannequin-6 Tenseur (1,) float32
étapes/observation/mannequin-7 Tenseur (1,) float32
étapes/observation/mannequin-8 Tenseur (1,) float32
étapes/observation/mannequin-9 Tenseur (1,) float32
pas/observation/extrémités Tenseur (12,) float32
pas/observation/head_height Tenseur (1,) float32
étapes/observation/joint_angles Tenseur (21,) float32
pas/observation/torse_vertical Tenseur (3,) float32
pas/observation/vitesse Tenseur (27,) float32
pas/récompense Tenseur (1,) float32

rlu_rwrl/humanoid_walk_combined_challenge_easy_100_percent

  • Taille du jeu de données : 7.53 GiB

  • Mise en cache automatique ( documentation ): Non

  • Fractionnements :

Diviser Exemples
'train' 20 000
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
retour_épisode Tenseur float32
pas Base de données
étapes/action Tenseur (21,) float32
étapes/réduction Tenseur (1,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
pas/observation/com_velocity Tenseur (3,) float32
pas/observation/mannequin-0 Tenseur (1,) float32
étapes/observation/mannequin-1 Tenseur (1,) float32
étapes/observation/mannequin-2 Tenseur (1,) float32
étapes/observation/mannequin-3 Tenseur (1,) float32
étapes/observation/mannequin-4 Tenseur (1,) float32
étapes/observation/mannequin-5 Tenseur (1,) float32
étapes/observation/mannequin-6 Tenseur (1,) float32
étapes/observation/mannequin-7 Tenseur (1,) float32
étapes/observation/mannequin-8 Tenseur (1,) float32
étapes/observation/mannequin-9 Tenseur (1,) float32
pas/observation/extrémités Tenseur (12,) float32
pas/observation/head_height Tenseur (1,) float32
étapes/observation/joint_angles Tenseur (21,) float32
pas/observation/torse_vertical Tenseur (3,) float32
pas/observation/vitesse Tenseur (27,) float32
pas/récompense Tenseur (1,) float32