d4rl_antmaze

 • Opis :

D4RL to punkt odniesienia typu open source do uczenia się przez wzmacnianie w trybie offline. Zapewnia standaryzowane środowiska i zbiory danych do algorytmów szkoleniowych i porównawczych.

Zbiory danych są zgodne z formatem RLDS i reprezentują kroki i odcinki.

FeaturesDict({
  'steps': Dataset({
    'action': Tensor(shape=(8,), dtype=float32),
    'discount': float32,
    'infos': FeaturesDict({
      'goal': Tensor(shape=(2,), dtype=float32),
      'qpos': Tensor(shape=(15,), dtype=float32),
      'qvel': Tensor(shape=(14,), dtype=float32),
    }),
    'is_first': bool,
    'is_last': bool,
    'is_terminal': bool,
    'observation': Tensor(shape=(29,), dtype=float32),
    'reward': float32,
  }),
})
 • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDykt
kroki Zbiór danych
kroki/akcja Napinacz (8,) pływak32
kroki/rabat Napinacz pływak32
kroki/informacje FunkcjeDykt
kroki/informacje/cel Napinacz (2,) pływak32
kroki/informacje/qpos Napinacz (15,) pływak32
kroki/informacje/kw Napinacz (14,) pływak32
kroki/jest_pierwszy Napinacz bool
kroki/jest_ostatni Napinacz bool
kroki/is_terminal Napinacz bool
kroki/obserwacje Napinacz (29,) pływak32
kroki/nagroda Napinacz pływak32
@misc{fu2020d4rl,
  title={D4RL: Datasets for Deep Data-Driven Reinforcement Learning},
  author={Justin Fu and Aviral Kumar and Ofir Nachum and George Tucker and Sergey Levine},
  year={2020},
  eprint={2004.07219},
  archivePrefix={arXiv},
  primaryClass={cs.LG}
}

d4rl_antmaze/umaze-v0 (konfiguracja domyślna)

 • Rozmiar pobierania : 221.76 MiB

 • Rozmiar zbioru danych : 274.83 MiB

 • Podziały :

Podział Przykłady
'train' 10154

d4rl_antmaze/umaze-diverse-v0

 • Rozmiar pobierania : 220.16 MiB

 • Rozmiar zbioru danych : 270.23 MiB

 • Podziały :

Podział Przykłady
'train' 1154

d4rl_antmaze/medium-play-v0

 • Rozmiar pobierania : 220.40 MiB

 • Rozmiar zbioru danych : 275.20 MiB

 • Podziały :

Podział Przykłady
'train' 10695

d4rl_antmaze/medium-diverse-v0

 • Rozmiar pobierania : 220.39 MiB

 • Rozmiar zbioru danych : 271.18 MiB

 • Podziały :

Podział Przykłady
'train' 2924

d4rl_antmaze/large-diverse-v0

 • Rozmiar pobierania : 220.47 MiB

 • Rozmiar zbioru danych : 273.36 MiB

 • Podziały :

Podział Przykłady
'train' 7141

d4rl_antmaze/large-play-v0

 • Rozmiar pobierania : 220.19 MiB

 • Rozmiar zbioru danych : 276.61 MiB

 • Podziały :

Podział Przykłady
'train' 13 458

d4rl_antmaze/umaze-v2

 • Rozmiar pobierania : 221.76 MiB

 • Rozmiar zbioru danych : 274.83 MiB

 • Podziały :

Podział Przykłady
'train' 10154

d4rl_antmaze/umaze-diverse-v2

 • Rozmiar pobierania : 220.16 MiB

 • Rozmiar zbioru danych : 270.20 MiB

 • Podziały :

Podział Przykłady
'train' 1036

d4rl_antmaze/medium-play-v2

 • Rozmiar pobierania : 220.40 MiB

 • Rozmiar zbioru danych : 275.22 MiB

 • Podziały :

Podział Przykłady
'train' 10768

d4rl_antmaze/medium-diverse-v2

 • Rozmiar pobierania : 220.39 MiB

 • Rozmiar zbioru danych : 271.19 MiB

 • Podziały :

Podział Przykłady
'train' 2959

d4rl_antmaze/large-diverse-v2

 • Rozmiar pobierania : 220.47 MiB

 • Rozmiar zbioru danych : 273.38 MiB

 • Podziały :

Podział Przykłady
'train' 7189

d4rl_antmaze/large-play-v2

 • Rozmiar pobierania : 220.18 MiB

 • Rozmiar zbioru danych : 276.63 MiB

 • Podziały :

Podział Przykłady
'train' 13517