- Açıklama :
Veri kümeleri, MuJoCo hareket görevlerinin çevre ödülü konusunda eğitilmiş bir SAC aracısı ile oluşturuldu. Bu veri kümeleri, Çekişmeli Taklit Öğrenimi İçin Ne Önemlidir? Orsini ve ark. 2021
Veri kümeleri, adımları ve bölümleri temsil etmek için RLDS biçimini izler.
Ana sayfa : https://github.com/google-research/rlds
Kaynak kodu :
tfds.rlds.locomotion.Locomotion
sürümler :
-
1.0.0
(varsayılan): İlk sürüm.
-
Denetlenen anahtarlar (Bkz
as_supervised
doc ):None
Şekil ( tfds.show_examples ): Desteklenmiyor.
Alıntı :
@article{orsini2021matters,
title={What Matters for Adversarial Imitation Learning?},
author={Orsini, Manu and Raichuk, Anton and Hussenot, L{'e}onard and Vincent, Damien and Dadashi, Robert and Girgin, Sertan and Geist, Matthieu and Bachem, Olivier and Pietquin, Olivier and Andrychowicz, Marcin},
journal={International Conference in Machine Learning},
year={2021}
}
locomotion/ant_sac_1M_single_policy_stochastic (varsayılan yapılandırma)
Yapılandırma açıklaması : Ant için 1 milyon adım için eğitilmiş bir SAC aracısı tarafından oluşturulan veri kümesi.
İndirme boyutu :
6.49 MiB
Veri kümesi boyutu :
23.02 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Evet
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 50 |
- Özellik yapısı :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(8,), dtype=float32),
'discount': float32,
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(111,), dtype=float32),
'reward': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
adımlar | veri kümesi | |||
adımlar/eylem | tensör | (8,) | şamandıra32 | |
adımlar/indirim | tensör | şamandıra32 | ||
adımlar/ilk_ilk | tensör | bool | ||
adımlar/is_last | tensör | bool | ||
adımlar/is_terminali | tensör | bool | ||
adımlar/gözlem | tensör | (111,) | şamandıra32 | |
adımlar/ödül | tensör | şamandıra32 |
- Örnekler ( tfds.as_dataframe ):
hareket/hopper_sac_1M_single_policy_stochastic
Yapılandırma açıklaması : Hopper için 1 milyon adım için eğitilmiş bir SAC aracısı tarafından oluşturulan veri kümesi.
İndirme boyutu :
2.26 MiB
Veri kümesi boyutu :
2.62 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Evet
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 50 |
- Özellik yapısı :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(3,), dtype=float32),
'discount': float32,
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(11,), dtype=float32),
'reward': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
adımlar | veri kümesi | |||
adımlar/eylem | tensör | (3,) | şamandıra32 | |
adımlar/indirim | tensör | şamandıra32 | ||
adımlar/ilk_ilk | tensör | bool | ||
adımlar/is_last | tensör | bool | ||
adımlar/is_terminali | tensör | bool | ||
adımlar/gözlem | tensör | (11,) | şamandıra32 | |
adımlar/ödül | tensör | şamandıra32 |
- Örnekler ( tfds.as_dataframe ):
hareket/halfcheetah_sac_1M_single_policy_stochastic
Yapılandırma açıklaması : HalfCheetah için 1 milyon adım için eğitilmiş bir SAC aracısı tarafından oluşturulan veri kümesi.
İndirme boyutu :
4.49 MiB
Veri kümesi boyutu :
4.93 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Evet
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 50 |
- Özellik yapısı :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': float32,
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(17,), dtype=float32),
'reward': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
adımlar | veri kümesi | |||
adımlar/eylem | tensör | (6,) | şamandıra32 | |
adımlar/indirim | tensör | şamandıra32 | ||
adımlar/ilk_ilk | tensör | bool | ||
adımlar/is_last | tensör | bool | ||
adımlar/is_terminali | tensör | bool | ||
adımlar/gözlem | tensör | (17,) | şamandıra32 | |
adımlar/ödül | tensör | şamandıra32 |
- Örnekler ( tfds.as_dataframe ):
hareket/walker2d_sac_1M_single_policy_stochastic
Yapılandırma açıklaması : Walker2d için 1 milyon adım için eğitilmiş bir SAC aracısı tarafından oluşturulan veri kümesi.
İndirme boyutu :
4.35 MiB
Veri kümesi boyutu :
4.91 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Evet
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 50 |
- Özellik yapısı :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': float32,
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(17,), dtype=float32),
'reward': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
adımlar | veri kümesi | |||
adımlar/eylem | tensör | (6,) | şamandıra32 | |
adımlar/indirim | tensör | şamandıra32 | ||
adımlar/ilk_ilk | tensör | bool | ||
adımlar/is_last | tensör | bool | ||
adımlar/is_terminali | tensör | bool | ||
adımlar/gözlem | tensör | (17,) | şamandıra32 | |
adımlar/ödül | tensör | şamandıra32 |
- Örnekler ( tfds.as_dataframe ):
hareket/insansı_sac_15M_single_policy_stochastic
Yapılandırma açıklaması : İnsansı için 15 milyon adım için eğitilmiş bir SAC aracısı tarafından oluşturulan veri kümesi.
İndirme boyutu :
192.78 MiB
Veri kümesi boyutu :
300.94 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 200 |
- Özellik yapısı :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(17,), dtype=float32),
'discount': float32,
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(376,), dtype=float32),
'reward': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
adımlar | veri kümesi | |||
adımlar/eylem | tensör | (17,) | şamandıra32 | |
adımlar/indirim | tensör | şamandıra32 | ||
adımlar/ilk_ilk | tensör | bool | ||
adımlar/is_last | tensör | bool | ||
adımlar/is_terminali | tensör | bool | ||
adımlar/gözlem | tensör | (376,) | şamandıra32 | |
adımlar/ödül | tensör | şamandıra32 |
- Örnekler ( tfds.as_dataframe ):