TFDS supporte désormais le format Croissant 🥐 ! Lisez la documentation pour en savoir plus.

Cette page a été traduite par l'API Cloud Translation.

d4rl_antmaze

Description :

D4RL est une référence open source pour l'apprentissage par renforcement hors ligne. Il fournit des environnements et des ensembles de données standardisés pour les algorithmes de formation et d’analyse comparative.

Les ensembles de données suivent le format RLDS pour représenter les étapes et les épisodes.

Description de la configuration : Voir plus de détails sur la tâche et ses versions sur https://github.com/rail-berkeley/d4rl/wiki/Tasks#antmaze
Page d'accueil : https://sites.google.com/view/d4rl-anonymous
Code source : tfds.d4rl.d4rl_antmaze.D4rlAntmaze
Versions :
- 1.0.0 : Version initiale.
- 1.1.1 (par défaut) : ajout d'ensembles de données v2.
Mise en cache automatique ( documentation ) : Non
Structure des fonctionnalités :

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float32),
        'discount': float32,
        'infos': FeaturesDict({
            'goal': Tensor(shape=(2,), dtype=float32),
            'qpos': Tensor(shape=(15,), dtype=float32),
            'qvel': Tensor(shape=(14,), dtype=float32),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(29,), dtype=float32),
        'reward': float32,
    }),
})

Documentation des fonctionnalités :

Fonctionnalité	Classe	Forme	Type D
	FonctionnalitésDict
pas	Base de données
étapes/actions	Tenseur	(8,)	flotteur32
étapes/remise	Tenseur		flotteur32
étapes/infos	FonctionnalitésDict
étapes/infos/objectif	Tenseur	(2,)	flotteur32
étapes/infos/qpos	Tenseur	(15,)	flotteur32
étapes/infos/qvel	Tenseur	(14,)	flotteur32
étapes/is_first	Tenseur		bouffon
étapes/est_dernier	Tenseur		bouffon
étapes/is_terminal	Tenseur		bouffon
étapes/observation	Tenseur	(29,)	flotteur32
étapes/récompense	Tenseur		flotteur32

Clés supervisées (Voir doc as_supervised ) : None
Figure ( tfds.show_examples ) : non pris en charge.
Citation :

@misc{fu2020d4rl,
    title={D4RL: Datasets for Deep Data-Driven Reinforcement Learning},
    author={Justin Fu and Aviral Kumar and Ofir Nachum and George Tucker and Sergey Levine},
    year={2020},
    eprint={2004.07219},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

d4rl_antmaze/umaze-v0 (configuration par défaut)

Taille du téléchargement : 221.76 MiB
Taille de l'ensemble de données : 274.83 MiB
Divisions :

Diviser	Exemples
`'train'`	10 154

Exemples ( tfds.as_dataframe ) :

d4rl_antmaze/umaze-diverse-v0

Taille du téléchargement : 220.16 MiB
Taille de l'ensemble de données : 270.23 MiB
Divisions :

Diviser	Exemples
`'train'`	1 154

Exemples ( tfds.as_dataframe ) :

d4rl_antmaze/medium-play-v0

Taille du téléchargement : 220.40 MiB
Taille de l'ensemble de données : 275.20 MiB
Divisions :

Diviser	Exemples
`'train'`	10 695

Exemples ( tfds.as_dataframe ) :

d4rl_antmaze/medium-diverse-v0

Taille du téléchargement : 220.39 MiB
Taille de l'ensemble de données : 271.18 MiB
Divisions :

Diviser	Exemples
`'train'`	2 924

Exemples ( tfds.as_dataframe ) :

d4rl_antmaze/large-diverse-v0

Taille du téléchargement : 220.47 MiB
Taille de l'ensemble de données : 273.36 MiB
Divisions :

Diviser	Exemples
`'train'`	7 141

Exemples ( tfds.as_dataframe ) :

d4rl_antmaze/large-play-v0

Taille du téléchargement : 220.19 MiB
Taille de l'ensemble de données : 276.61 MiB
Divisions :

Diviser	Exemples
`'train'`	13 458

Exemples ( tfds.as_dataframe ) :

d4rl_antmaze/umaze-v2

Taille du téléchargement : 221.76 MiB
Taille de l'ensemble de données : 274.83 MiB
Divisions :

Diviser	Exemples
`'train'`	10 154

Exemples ( tfds.as_dataframe ) :

d4rl_antmaze/umaze-diverse-v2

Taille du téléchargement : 220.16 MiB
Taille de l'ensemble de données : 270.20 MiB
Divisions :

Diviser	Exemples
`'train'`	1 036

Exemples ( tfds.as_dataframe ) :

d4rl_antmaze/medium-play-v2

Taille du téléchargement : 220.40 MiB
Taille de l'ensemble de données : 275.22 MiB
Divisions :

Diviser	Exemples
`'train'`	10 768

Exemples ( tfds.as_dataframe ) :

d4rl_antmaze/medium-diverse-v2

Taille du téléchargement : 220.39 MiB
Taille de l'ensemble de données : 271.19 MiB
Divisions :

Diviser	Exemples
`'train'`	2 959

Exemples ( tfds.as_dataframe ) :

d4rl_antmaze/large-diverse-v2

Taille du téléchargement : 220.47 MiB
Taille de l'ensemble de données : 273.38 MiB
Divisions :

Diviser	Exemples
`'train'`	7 189

Exemples ( tfds.as_dataframe ) :

d4rl_antmaze/large-play-v2

Taille du téléchargement : 220.18 MiB
Taille de l'ensemble de données : 276.63 MiB
Divisions :

Diviser	Exemples
`'train'`	13 517

Exemples ( tfds.as_dataframe ) :