d4rl_antmaze

  • Deskripsi :

D4RL adalah tolok ukur sumber terbuka untuk pembelajaran penguatan offline. Ini menyediakan lingkungan dan kumpulan data standar untuk pelatihan dan algoritma benchmarking.

Kumpulan data mengikuti format RLDS untuk mewakili langkah dan episode.

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float32),
        'discount': float32,
        'infos': FeaturesDict({
            'goal': Tensor(shape=(2,), dtype=float32),
            'qpos': Tensor(shape=(15,), dtype=float32),
            'qvel': Tensor(shape=(14,), dtype=float32),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(29,), dtype=float32),
        'reward': float32,
    }),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Tipe D Keterangan
FiturDict
Langkah Himpunan data
langkah/tindakan Tensor (8,) float32
langkah/diskon Tensor float32
langkah/info FiturDict
langkah/info/tujuan Tensor (2,) float32
langkah/info/qpos Tensor (15,) float32
langkah/info/qvel Tensor (14,) float32
langkah/adalah_pertama Tensor bodoh
langkah/adalah_terakhir Tensor bodoh
langkah/is_terminal Tensor bodoh
langkah/pengamatan Tensor (29,) float32
langkah/hadiah Tensor float32
@misc{fu2020d4rl,
    title={D4RL: Datasets for Deep Data-Driven Reinforcement Learning},
    author={Justin Fu and Aviral Kumar and Ofir Nachum and George Tucker and Sergey Levine},
    year={2020},
    eprint={2004.07219},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

d4rl_antmaze/umaze-v0 (konfigurasi default)

  • Ukuran unduhan : 221.76 MiB

  • Ukuran kumpulan data : 274.83 MiB

  • Perpecahan :

Membelah Contoh
'train' 10.154

d4rl_antmaze/umaze-diverse-v0

  • Ukuran unduhan : 220.16 MiB

  • Ukuran kumpulan data : 270.23 MiB

  • Perpecahan :

Membelah Contoh
'train' 1.154

d4rl_antmaze/medium-play-v0

  • Ukuran unduhan : 220.40 MiB

  • Ukuran kumpulan data : 275.20 MiB

  • Perpecahan :

Membelah Contoh
'train' 10.695

d4rl_antmaze/medium-diverse-v0

  • Ukuran unduhan : 220.39 MiB

  • Ukuran kumpulan data : 271.18 MiB

  • Perpecahan :

Membelah Contoh
'train' 2.924

d4rl_antmaze/large-diverse-v0

  • Ukuran unduhan : 220.47 MiB

  • Ukuran kumpulan data : 273.36 MiB

  • Perpecahan :

Membelah Contoh
'train' 7.141

d4rl_antmaze/large-play-v0

  • Ukuran unduhan : 220.19 MiB

  • Ukuran kumpulan data : 276.61 MiB

  • Perpecahan :

Membelah Contoh
'train' 13.458

d4rl_antmaze/umaze-v2

  • Ukuran unduhan : 221.76 MiB

  • Ukuran kumpulan data : 274.83 MiB

  • Perpecahan :

Membelah Contoh
'train' 10.154

d4rl_antmaze/umaze-diverse-v2

  • Ukuran unduhan : 220.16 MiB

  • Ukuran kumpulan data : 270.20 MiB

  • Perpecahan :

Membelah Contoh
'train' 1.036

d4rl_antmaze/medium-play-v2

  • Ukuran unduhan : 220.40 MiB

  • Ukuran kumpulan data : 275.22 MiB

  • Perpecahan :

Membelah Contoh
'train' 10.768

d4rl_antmaze/medium-diverse-v2

  • Ukuran unduhan : 220.39 MiB

  • Ukuran kumpulan data : 271.19 MiB

  • Perpecahan :

Membelah Contoh
'train' 2.959

d4rl_antmaze/beragam-besar-v2

  • Ukuran unduhan : 220.47 MiB

  • Ukuran kumpulan data : 273.38 MiB

  • Perpecahan :

Membelah Contoh
'train' 7.189

d4rl_antmaze/large-play-v2

  • Ukuran unduhan : 220.18 MiB

  • Ukuran kumpulan data : 276.63 MiB

  • Perpecahan :

Membelah Contoh
'train' 13.517