hareket

  • Açıklama :

Veri kümeleri, MuJoCo hareket görevlerinin çevre ödülü konusunda eğitilmiş bir SAC aracısı ile oluşturulmuştur. Bu veri kümeleri, Düşman Taklitiyle Öğrenme için Ne Önemlidir? Orsini et al. 2021 .

Veri kümeleri, adımları ve bölümleri temsil etmek için RLDS biçimini takip eder.

@article{orsini2021matters,
  title={What Matters for Adversarial Imitation Learning?},
  author={Orsini, Manu and Raichuk, Anton and Hussenot, L{'e}onard and Vincent, Damien and Dadashi, Robert and Girgin, Sertan and Geist, Matthieu and Bachem, Olivier and Pietquin, Olivier and Andrychowicz, Marcin},
  journal={International Conference in Machine Learning},
  year={2021}
}

locomotion/ant_sac_1M_single_policy_stochastic (varsayılan yapılandırma)

  • Yapılandırma açıklaması : Ant için 1 milyon adım için eğitilmiş bir SAC aracısı tarafından oluşturulan veri kümesi.

  • İndirme boyutu : 6.49 MiB

  • Veri kümesi boyutu : 23.02 MiB

  • Otomatik önbelleğe alınmış ( belgeler ): Evet

  • Bölmeler :

Bölmek Örnekler
'train' 50
  • Özellik yapısı :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=tf.float32),
        'discount': tf.float32,
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': Tensor(shape=(111,), dtype=tf.float32),
        'reward': tf.float32,
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtype Tanım
ÖzelliklerDict
adımlar veri kümesi
adımlar/eylem tensör (8,) tf.float32
adımlar/indirim tensör tf.float32
adımlar/is_first tensör tf.bool
adımlar/is_last tensör tf.bool
adımlar/is_terminal tensör tf.bool
adımlar/gözlem tensör (111,) tf.float32
adımlar/ödül tensör tf.float32

hareket/hazne_sac_1M_single_policy_stochastic

  • Yapılandırma açıklaması : Hopper için 1 milyon adım için eğitilmiş bir SAC aracısı tarafından oluşturulan veri kümesi.

  • İndirme boyutu : 2.26 MiB

  • Veri kümesi boyutu : 2.62 MiB

  • Otomatik önbelleğe alınmış ( belgeler ): Evet

  • Bölmeler :

Bölmek Örnekler
'train' 50
  • Özellik yapısı :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(3,), dtype=tf.float32),
        'discount': tf.float32,
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': Tensor(shape=(11,), dtype=tf.float32),
        'reward': tf.float32,
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtype Tanım
ÖzelliklerDict
adımlar veri kümesi
adımlar/eylem tensör (3,) tf.float32
adımlar/indirim tensör tf.float32
adımlar/is_first tensör tf.bool
adımlar/is_last tensör tf.bool
adımlar/is_terminal tensör tf.bool
adımlar/gözlem tensör (11,) tf.float32
adımlar/ödül tensör tf.float32

hareket/halfcheetah_sac_1M_single_policy_stochastic

  • Yapılandırma açıklaması : HalfCheetah için 1 milyon adım için eğitilmiş bir SAC aracısı tarafından oluşturulan veri kümesi.

  • İndirme boyutu : 4.49 MiB

  • Veri kümesi boyutu : 4.93 MiB

  • Otomatik önbelleğe alınmış ( belgeler ): Evet

  • Bölmeler :

Bölmek Örnekler
'train' 50
  • Özellik yapısı :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=tf.float32),
        'discount': tf.float32,
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': Tensor(shape=(17,), dtype=tf.float32),
        'reward': tf.float32,
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtype Tanım
ÖzelliklerDict
adımlar veri kümesi
adımlar/eylem tensör (6,) tf.float32
adımlar/indirim tensör tf.float32
adımlar/is_first tensör tf.bool
adımlar/is_last tensör tf.bool
adımlar/is_terminal tensör tf.bool
adımlar/gözlem tensör (17,) tf.float32
adımlar/ödül tensör tf.float32

hareket/walker2d_sac_1M_single_policy_stochastic

  • Yapılandırma açıklaması : Walker2d için 1 milyon adım için eğitilmiş bir SAC aracısı tarafından oluşturulan veri kümesi.

  • İndirme boyutu : 4.35 MiB

  • Veri kümesi boyutu : 4.91 MiB

  • Otomatik önbelleğe alınmış ( belgeler ): Evet

  • Bölmeler :

Bölmek Örnekler
'train' 50
  • Özellik yapısı :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=tf.float32),
        'discount': tf.float32,
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': Tensor(shape=(17,), dtype=tf.float32),
        'reward': tf.float32,
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtype Tanım
ÖzelliklerDict
adımlar veri kümesi
adımlar/eylem tensör (6,) tf.float32
adımlar/indirim tensör tf.float32
adımlar/is_first tensör tf.bool
adımlar/is_last tensör tf.bool
adımlar/is_terminal tensör tf.bool
adımlar/gözlem tensör (17,) tf.float32
adımlar/ödül tensör tf.float32

hareket/insansı_sac_15M_single_policy_stochastic

  • Yapılandırma açıklaması : Humanoid için 15 milyon adım için eğitilmiş bir SAC aracısı tarafından oluşturulan veri kümesi.

  • İndirme boyutu : 192.78 MiB

  • Veri kümesi boyutu : 300.94 MiB

  • Otomatik önbelleğe alındı ​​( belgeler ): Hayır

  • Bölmeler :

Bölmek Örnekler
'train' 200
  • Özellik yapısı :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(17,), dtype=tf.float32),
        'discount': tf.float32,
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': Tensor(shape=(376,), dtype=tf.float32),
        'reward': tf.float32,
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtype Tanım
ÖzelliklerDict
adımlar veri kümesi
adımlar/eylem tensör (17,) tf.float32
adımlar/indirim tensör tf.float32
adımlar/is_first tensör tf.bool
adımlar/is_last tensör tf.bool
adımlar/is_terminal tensör tf.bool
adımlar/gözlem tensör (376,) tf.float32
adımlar/ödül tensör tf.float32