hareket

  • Açıklama :

Veri kümeleri, MuJoCo hareket görevlerinin çevre ödülü konusunda eğitilmiş bir SAC aracısı ile oluşturuldu. Bu veri kümeleri, Çekişmeli Taklit Öğrenimi İçin Ne Önemlidir? Orsini ve ark. 2021

Veri kümeleri, adımları ve bölümleri temsil etmek için RLDS biçimini izler.

@article{orsini2021matters,
  title={What Matters for Adversarial Imitation Learning?},
  author={Orsini, Manu and Raichuk, Anton and Hussenot, L{'e}onard and Vincent, Damien and Dadashi, Robert and Girgin, Sertan and Geist, Matthieu and Bachem, Olivier and Pietquin, Olivier and Andrychowicz, Marcin},
  journal={International Conference in Machine Learning},
  year={2021}
}

locomotion/ant_sac_1M_single_policy_stochastic (varsayılan yapılandırma)

  • Yapılandırma açıklaması : Ant için 1 milyon adım için eğitilmiş bir SAC aracısı tarafından oluşturulan veri kümesi.

  • İndirme boyutu : 6.49 MiB

  • Veri kümesi boyutu : 23.02 MiB

  • Otomatik önbelleğe alınmış ( belgeleme ): Evet

  • bölmeler :

Bölmek örnekler
'train' 50
  • Özellik yapısı :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(111,), dtype=float32),
        'reward': float32,
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
adımlar veri kümesi
adımlar/eylem tensör (8,) şamandıra32
adımlar/indirim tensör şamandıra32
adımlar/ilk_ilk tensör bool
adımlar/is_last tensör bool
adımlar/is_terminali tensör bool
adımlar/gözlem tensör (111,) şamandıra32
adımlar/ödül tensör şamandıra32

hareket/hopper_sac_1M_single_policy_stochastic

  • Yapılandırma açıklaması : Hopper için 1 milyon adım için eğitilmiş bir SAC aracısı tarafından oluşturulan veri kümesi.

  • İndirme boyutu : 2.26 MiB

  • Veri kümesi boyutu : 2.62 MiB

  • Otomatik önbelleğe alınmış ( belgeleme ): Evet

  • bölmeler :

Bölmek örnekler
'train' 50
  • Özellik yapısı :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(3,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(11,), dtype=float32),
        'reward': float32,
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
adımlar veri kümesi
adımlar/eylem tensör (3,) şamandıra32
adımlar/indirim tensör şamandıra32
adımlar/ilk_ilk tensör bool
adımlar/is_last tensör bool
adımlar/is_terminali tensör bool
adımlar/gözlem tensör (11,) şamandıra32
adımlar/ödül tensör şamandıra32

hareket/halfcheetah_sac_1M_single_policy_stochastic

  • Yapılandırma açıklaması : HalfCheetah için 1 milyon adım için eğitilmiş bir SAC aracısı tarafından oluşturulan veri kümesi.

  • İndirme boyutu : 4.49 MiB

  • Veri kümesi boyutu : 4.93 MiB

  • Otomatik önbelleğe alınmış ( belgeleme ): Evet

  • bölmeler :

Bölmek örnekler
'train' 50
  • Özellik yapısı :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(17,), dtype=float32),
        'reward': float32,
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
adımlar veri kümesi
adımlar/eylem tensör (6,) şamandıra32
adımlar/indirim tensör şamandıra32
adımlar/ilk_ilk tensör bool
adımlar/is_last tensör bool
adımlar/is_terminali tensör bool
adımlar/gözlem tensör (17,) şamandıra32
adımlar/ödül tensör şamandıra32

hareket/walker2d_sac_1M_single_policy_stochastic

  • Yapılandırma açıklaması : Walker2d için 1 milyon adım için eğitilmiş bir SAC aracısı tarafından oluşturulan veri kümesi.

  • İndirme boyutu : 4.35 MiB

  • Veri kümesi boyutu : 4.91 MiB

  • Otomatik önbelleğe alınmış ( belgeleme ): Evet

  • bölmeler :

Bölmek örnekler
'train' 50
  • Özellik yapısı :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(17,), dtype=float32),
        'reward': float32,
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
adımlar veri kümesi
adımlar/eylem tensör (6,) şamandıra32
adımlar/indirim tensör şamandıra32
adımlar/ilk_ilk tensör bool
adımlar/is_last tensör bool
adımlar/is_terminali tensör bool
adımlar/gözlem tensör (17,) şamandıra32
adımlar/ödül tensör şamandıra32

hareket/insansı_sac_15M_single_policy_stochastic

  • Yapılandırma açıklaması : İnsansı için 15 milyon adım için eğitilmiş bir SAC aracısı tarafından oluşturulan veri kümesi.

  • İndirme boyutu : 192.78 MiB

  • Veri kümesi boyutu : 300.94 MiB

  • Otomatik önbelleğe alınmış ( belgeleme ): Hayır

  • bölmeler :

Bölmek örnekler
'train' 200
  • Özellik yapısı :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(17,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(376,), dtype=float32),
        'reward': float32,
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
adımlar veri kümesi
adımlar/eylem tensör (17,) şamandıra32
adımlar/indirim tensör şamandıra32
adımlar/ilk_ilk tensör bool
adımlar/is_last tensör bool
adımlar/is_terminali tensör bool
adımlar/gözlem tensör (376,) şamandıra32
adımlar/ödül tensör şamandıra32