Merci de vous être connecté à Google I/O. Voir toutes les sessions à la demande Regarder à la demande

d4rl_antmaze

  • Descriptif :

D4RL est une référence open source pour l'apprentissage par renforcement hors ligne. Il fournit des environnements et des ensembles de données standardisés pour les algorithmes de formation et d'analyse comparative.

Les ensembles de données suivent le format RLDS pour représenter les étapes et les épisodes.

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float32),
        'discount': float32,
        'infos': FeaturesDict({
            'goal': Tensor(shape=(2,), dtype=float32),
            'qpos': Tensor(shape=(15,), dtype=float32),
            'qvel': Tensor(shape=(14,), dtype=float32),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(29,), dtype=float32),
        'reward': float32,
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
pas Base de données
étapes/action Tenseur (8,) float32
étapes/réduction Tenseur float32
étapes/infos FonctionnalitésDict
étapes/infos/objectif Tenseur (2,) float32
étapes/infos/qpos Tenseur (15,) float32
étapes/infos/qvel Tenseur (14,) float32
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation Tenseur (29,) float32
pas/récompense Tenseur float32
@misc{fu2020d4rl,
    title={D4RL: Datasets for Deep Data-Driven Reinforcement Learning},
    author={Justin Fu and Aviral Kumar and Ofir Nachum and George Tucker and Sergey Levine},
    year={2020},
    eprint={2004.07219},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

d4rl_antmaze/umaze-v0 (configuration par défaut)

  • Taille du téléchargement : 221.76 MiB

  • Taille du jeu de données : 274.83 MiB

  • Fractionnements :

Diviser Exemples
'train' 10 154

d4rl_antmaze/umaze-diverse-v0

  • Taille du téléchargement : 220.16 MiB

  • Taille du jeu de données : 270.23 MiB

  • Fractionnements :

Diviser Exemples
'train' 1 154

d4rl_antmaze/medium-play-v0

  • Taille du téléchargement : 220.40 MiB

  • Taille du jeu de données : 275.20 MiB

  • Fractionnements :

Diviser Exemples
'train' 10 695

d4rl_antmaze/moyen-divers-v0

  • Taille du téléchargement : 220.39 MiB

  • Taille du jeu de données : 271.18 MiB

  • Fractionnements :

Diviser Exemples
'train' 2 924

d4rl_antmaze/large-diverse-v0

  • Taille du téléchargement : 220.47 MiB

  • Taille du jeu de données : 273.36 MiB

  • Fractionnements :

Diviser Exemples
'train' 7 141

d4rl_antmaze/large-play-v0

  • Taille du téléchargement : 220.19 MiB

  • Taille du jeu de données : 276.61 MiB

  • Fractionnements :

Diviser Exemples
'train' 13 458