- Açıklama :
Veri kümeleri, MuJoCo hareket görevlerinin çevre ödülü konusunda eğitilmiş bir SAC aracısı ile oluşturulmuştur. Bu veri kümeleri, Düşman Taklitiyle Öğrenme için Ne Önemlidir? Orsini et al. 2021 .
Veri kümeleri, adımları ve bölümleri temsil etmek için RLDS biçimini takip eder.
Ana sayfa : https://github.com/google-research/rlds
Kaynak kodu :
tfds.rlds.locomotion.Locomotion
Sürümler :
-
1.0.0
(varsayılan): İlk sürüm.
-
Denetimli anahtarlar (bkz
as_supervised
doc ):None
Şekil ( tfds.show_examples ): Desteklenmez.
alıntı :
@article{orsini2021matters,
title={What Matters for Adversarial Imitation Learning?},
author={Orsini, Manu and Raichuk, Anton and Hussenot, L{'e}onard and Vincent, Damien and Dadashi, Robert and Girgin, Sertan and Geist, Matthieu and Bachem, Olivier and Pietquin, Olivier and Andrychowicz, Marcin},
journal={International Conference in Machine Learning},
year={2021}
}
locomotion/ant_sac_1M_single_policy_stochastic (varsayılan yapılandırma)
Yapılandırma açıklaması : Ant için 1 milyon adım için eğitilmiş bir SAC aracısı tarafından oluşturulan veri kümesi.
İndirme boyutu :
6.49 MiB
Veri kümesi boyutu :
23.02 MiB
Otomatik önbelleğe alınmış ( belgeler ): Evet
Bölmeler :
Bölmek | Örnekler |
---|---|
'train' | 50 |
- Özellik yapısı :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(8,), dtype=tf.float32),
'discount': tf.float32,
'is_first': tf.bool,
'is_last': tf.bool,
'is_terminal': tf.bool,
'observation': Tensor(shape=(111,), dtype=tf.float32),
'reward': tf.float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtype | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
adımlar | veri kümesi | |||
adımlar/eylem | tensör | (8,) | tf.float32 | |
adımlar/indirim | tensör | tf.float32 | ||
adımlar/is_first | tensör | tf.bool | ||
adımlar/is_last | tensör | tf.bool | ||
adımlar/is_terminal | tensör | tf.bool | ||
adımlar/gözlem | tensör | (111,) | tf.float32 | |
adımlar/ödül | tensör | tf.float32 |
- Örnekler ( tfds.as_dataframe ):
hareket/hazne_sac_1M_single_policy_stochastic
Yapılandırma açıklaması : Hopper için 1 milyon adım için eğitilmiş bir SAC aracısı tarafından oluşturulan veri kümesi.
İndirme boyutu :
2.26 MiB
Veri kümesi boyutu :
2.62 MiB
Otomatik önbelleğe alınmış ( belgeler ): Evet
Bölmeler :
Bölmek | Örnekler |
---|---|
'train' | 50 |
- Özellik yapısı :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(3,), dtype=tf.float32),
'discount': tf.float32,
'is_first': tf.bool,
'is_last': tf.bool,
'is_terminal': tf.bool,
'observation': Tensor(shape=(11,), dtype=tf.float32),
'reward': tf.float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtype | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
adımlar | veri kümesi | |||
adımlar/eylem | tensör | (3,) | tf.float32 | |
adımlar/indirim | tensör | tf.float32 | ||
adımlar/is_first | tensör | tf.bool | ||
adımlar/is_last | tensör | tf.bool | ||
adımlar/is_terminal | tensör | tf.bool | ||
adımlar/gözlem | tensör | (11,) | tf.float32 | |
adımlar/ödül | tensör | tf.float32 |
- Örnekler ( tfds.as_dataframe ):
hareket/halfcheetah_sac_1M_single_policy_stochastic
Yapılandırma açıklaması : HalfCheetah için 1 milyon adım için eğitilmiş bir SAC aracısı tarafından oluşturulan veri kümesi.
İndirme boyutu :
4.49 MiB
Veri kümesi boyutu :
4.93 MiB
Otomatik önbelleğe alınmış ( belgeler ): Evet
Bölmeler :
Bölmek | Örnekler |
---|---|
'train' | 50 |
- Özellik yapısı :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=tf.float32),
'discount': tf.float32,
'is_first': tf.bool,
'is_last': tf.bool,
'is_terminal': tf.bool,
'observation': Tensor(shape=(17,), dtype=tf.float32),
'reward': tf.float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtype | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
adımlar | veri kümesi | |||
adımlar/eylem | tensör | (6,) | tf.float32 | |
adımlar/indirim | tensör | tf.float32 | ||
adımlar/is_first | tensör | tf.bool | ||
adımlar/is_last | tensör | tf.bool | ||
adımlar/is_terminal | tensör | tf.bool | ||
adımlar/gözlem | tensör | (17,) | tf.float32 | |
adımlar/ödül | tensör | tf.float32 |
- Örnekler ( tfds.as_dataframe ):
hareket/walker2d_sac_1M_single_policy_stochastic
Yapılandırma açıklaması : Walker2d için 1 milyon adım için eğitilmiş bir SAC aracısı tarafından oluşturulan veri kümesi.
İndirme boyutu :
4.35 MiB
Veri kümesi boyutu :
4.91 MiB
Otomatik önbelleğe alınmış ( belgeler ): Evet
Bölmeler :
Bölmek | Örnekler |
---|---|
'train' | 50 |
- Özellik yapısı :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=tf.float32),
'discount': tf.float32,
'is_first': tf.bool,
'is_last': tf.bool,
'is_terminal': tf.bool,
'observation': Tensor(shape=(17,), dtype=tf.float32),
'reward': tf.float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtype | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
adımlar | veri kümesi | |||
adımlar/eylem | tensör | (6,) | tf.float32 | |
adımlar/indirim | tensör | tf.float32 | ||
adımlar/is_first | tensör | tf.bool | ||
adımlar/is_last | tensör | tf.bool | ||
adımlar/is_terminal | tensör | tf.bool | ||
adımlar/gözlem | tensör | (17,) | tf.float32 | |
adımlar/ödül | tensör | tf.float32 |
- Örnekler ( tfds.as_dataframe ):
hareket/insansı_sac_15M_single_policy_stochastic
Yapılandırma açıklaması : Humanoid için 15 milyon adım için eğitilmiş bir SAC aracısı tarafından oluşturulan veri kümesi.
İndirme boyutu :
192.78 MiB
Veri kümesi boyutu :
300.94 MiB
Otomatik önbelleğe alındı ( belgeler ): Hayır
Bölmeler :
Bölmek | Örnekler |
---|---|
'train' | 200 |
- Özellik yapısı :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(17,), dtype=tf.float32),
'discount': tf.float32,
'is_first': tf.bool,
'is_last': tf.bool,
'is_terminal': tf.bool,
'observation': Tensor(shape=(376,), dtype=tf.float32),
'reward': tf.float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtype | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
adımlar | veri kümesi | |||
adımlar/eylem | tensör | (17,) | tf.float32 | |
adımlar/indirim | tensör | tf.float32 | ||
adımlar/is_first | tensör | tf.bool | ||
adımlar/is_last | tensör | tf.bool | ||
adımlar/is_terminal | tensör | tf.bool | ||
adımlar/gözlem | tensör | (376,) | tf.float32 | |
adımlar/ödül | tensör | tf.float32 |
- Örnekler ( tfds.as_dataframe ):