d4rl_antmaze

  • Descriptif :

D4RL est une référence open source pour l'apprentissage par renforcement hors ligne. Il fournit des environnements et des ensembles de données standardisés pour les algorithmes de formation et d’analyse comparative.

Les ensembles de données suivent le format RLDS pour représenter les étapes et les épisodes.

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float32),
        'discount': float32,
        'infos': FeaturesDict({
            'goal': Tensor(shape=(2,), dtype=float32),
            'qpos': Tensor(shape=(15,), dtype=float32),
            'qvel': Tensor(shape=(14,), dtype=float32),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(29,), dtype=float32),
        'reward': float32,
    }),
})
  • Documentation des fonctionnalités :
Fonctionnalité Classe Forme Type D Description
FonctionnalitésDict
pas Base de données
étapes/actions Tenseur (8,) flotteur32
étapes/remise Tenseur flotteur32
étapes/infos FonctionnalitésDict
étapes/infos/objectif Tenseur (2,) flotteur32
étapes/infos/qpos Tenseur (15,) flotteur32
étapes/infos/qvel Tenseur (14,) flotteur32
étapes/is_first Tenseur bouffon
étapes/est_dernier Tenseur bouffon
étapes/is_terminal Tenseur bouffon
étapes/observation Tenseur (29,) flotteur32
étapes/récompense Tenseur flotteur32
@misc{fu2020d4rl,
    title={D4RL: Datasets for Deep Data-Driven Reinforcement Learning},
    author={Justin Fu and Aviral Kumar and Ofir Nachum and George Tucker and Sergey Levine},
    year={2020},
    eprint={2004.07219},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

d4rl_antmaze/umaze-v0 (configuration par défaut)

  • Taille du téléchargement : 221.76 MiB

  • Taille de l'ensemble de données : 274.83 MiB

  • Divisions :

Diviser Exemples
'train' 10 154

d4rl_antmaze/umaze-diverse-v0

  • Taille du téléchargement : 220.16 MiB

  • Taille de l'ensemble de données : 270.23 MiB

  • Divisions :

Diviser Exemples
'train' 1 154

d4rl_antmaze/medium-play-v0

  • Taille du téléchargement : 220.40 MiB

  • Taille de l'ensemble de données : 275.20 MiB

  • Divisions :

Diviser Exemples
'train' 10 695

d4rl_antmaze/medium-diverse-v0

  • Taille du téléchargement : 220.39 MiB

  • Taille de l'ensemble de données : 271.18 MiB

  • Divisions :

Diviser Exemples
'train' 2 924

d4rl_antmaze/large-diverse-v0

  • Taille du téléchargement : 220.47 MiB

  • Taille de l'ensemble de données : 273.36 MiB

  • Divisions :

Diviser Exemples
'train' 7 141

d4rl_antmaze/large-play-v0

  • Taille du téléchargement : 220.19 MiB

  • Taille de l'ensemble de données : 276.61 MiB

  • Divisions :

Diviser Exemples
'train' 13 458

d4rl_antmaze/umaze-v2

  • Taille du téléchargement : 221.76 MiB

  • Taille de l'ensemble de données : 274.83 MiB

  • Divisions :

Diviser Exemples
'train' 10 154

d4rl_antmaze/umaze-diverse-v2

  • Taille du téléchargement : 220.16 MiB

  • Taille de l'ensemble de données : 270.20 MiB

  • Divisions :

Diviser Exemples
'train' 1 036

d4rl_antmaze/medium-play-v2

  • Taille du téléchargement : 220.40 MiB

  • Taille de l'ensemble de données : 275.22 MiB

  • Divisions :

Diviser Exemples
'train' 10 768

d4rl_antmaze/medium-diverse-v2

  • Taille du téléchargement : 220.39 MiB

  • Taille de l'ensemble de données : 271.19 MiB

  • Divisions :

Diviser Exemples
'train' 2 959

d4rl_antmaze/large-diverse-v2

  • Taille du téléchargement : 220.47 MiB

  • Taille de l'ensemble de données : 273.38 MiB

  • Divisions :

Diviser Exemples
'train' 7 189

d4rl_antmaze/large-play-v2

  • Taille du téléchargement : 220.18 MiB

  • Taille de l'ensemble de données : 276.63 MiB

  • Divisions :

Diviser Exemples
'train' 13 517