- Açıklama :
D4RL, çevrimdışı pekiştirmeli öğrenim için açık kaynaklı bir kıyaslamadır. Eğitim ve kıyaslama algoritmaları için standartlaştırılmış ortamlar ve veri kümeleri sağlar.
Veri kümeleri, adımları ve bölümleri temsil etmek için RLDS biçimini izler.
Yapılandırma açıklaması : https://github.com/rail-berkeley/d4rl/wiki/Tasks#gym adresinde görev ve sürümleri hakkında daha fazla ayrıntı görün
Ana Sayfa : https://sites.google.com/view/d4rl/home
Kaynak kodu :
tfds.d4rl.d4rl_mujoco_halfcheetah.D4rlMujocoHalfcheetah
sürümler :
-
1.0.0
: İlk sürüm. -
1.0.1
: Bölüm ve adım meta verileri için destek ve ödül şeklinin tüm yapılandırmalarda birleştirilmesi. -
1.1.0
: is_last eklendi. -
1.2.0
(varsayılan): Bir sonraki gözlemi dikkate alacak şekilde güncellendi.
-
Denetlenen anahtarlar (Bkz
as_supervised
doc ):None
Şekil ( tfds.show_examples ): Desteklenmiyor.
Alıntı :
@misc{fu2020d4rl,
title={D4RL: Datasets for Deep Data-Driven Reinforcement Learning},
author={Justin Fu and Aviral Kumar and Ofir Nachum and George Tucker and Sergey Levine},
year={2020},
eprint={2004.07219},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
d4rl_mujoco_halfcheetah/v0-uzman (varsayılan yapılandırma)
İndirme boyutu :
83.44 MiB
Veri kümesi boyutu :
98.43 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Evet
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.002 |
- Özellik yapısı :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': float32,
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(17,), dtype=float32),
'reward': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
adımlar | veri kümesi | |||
adımlar/eylem | tensör | (6,) | şamandıra32 | |
adımlar/indirim | tensör | şamandıra32 | ||
adımlar/ilk_ilk | tensör | bool | ||
adımlar/is_last | tensör | bool | ||
adımlar/is_terminali | tensör | bool | ||
adımlar/gözlem | tensör | (17,) | şamandıra32 | |
adımlar/ödül | tensör | şamandıra32 |
- Örnekler ( tfds.as_dataframe ):
d4rl_mujoco_halfcheetah/v0-orta
İndirme boyutu :
82.92 MiB
Veri kümesi boyutu :
98.43 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Evet
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.002 |
- Özellik yapısı :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': float32,
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(17,), dtype=float32),
'reward': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
adımlar | veri kümesi | |||
adımlar/eylem | tensör | (6,) | şamandıra32 | |
adımlar/indirim | tensör | şamandıra32 | ||
adımlar/ilk_ilk | tensör | bool | ||
adımlar/is_last | tensör | bool | ||
adımlar/is_terminali | tensör | bool | ||
adımlar/gözlem | tensör | (17,) | şamandıra32 | |
adımlar/ödül | tensör | şamandıra32 |
- Örnekler ( tfds.as_dataframe ):
d4rl_mujoco_halfcheetah/v0-orta-uzman
İndirme boyutu :
166.36 MiB
Veri kümesi boyutu :
196.86 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Yalnızca
shuffle_files=False
(tren) olduğundabölmeler :
Bölmek | örnekler |
---|---|
'train' | 2.004 |
- Özellik yapısı :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': float32,
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(17,), dtype=float32),
'reward': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
adımlar | veri kümesi | |||
adımlar/eylem | tensör | (6,) | şamandıra32 | |
adımlar/indirim | tensör | şamandıra32 | ||
adımlar/ilk_ilk | tensör | bool | ||
adımlar/is_last | tensör | bool | ||
adımlar/is_terminali | tensör | bool | ||
adımlar/gözlem | tensör | (17,) | şamandıra32 | |
adımlar/ödül | tensör | şamandıra32 |
- Örnekler ( tfds.as_dataframe ):
d4rl_mujoco_halfcheetah/v0-mixed
İndirme boyutu :
8.60 MiB
Veri kümesi boyutu :
9.94 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Evet
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 101 |
- Özellik yapısı :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': float32,
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(17,), dtype=float32),
'reward': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
adımlar | veri kümesi | |||
adımlar/eylem | tensör | (6,) | şamandıra32 | |
adımlar/indirim | tensör | şamandıra32 | ||
adımlar/ilk_ilk | tensör | bool | ||
adımlar/is_last | tensör | bool | ||
adımlar/is_terminali | tensör | bool | ||
adımlar/gözlem | tensör | (17,) | şamandıra32 | |
adımlar/ödül | tensör | şamandıra32 |
- Örnekler ( tfds.as_dataframe ):
d4rl_mujoco_halfcheetah/v0-rastgele
İndirme boyutu :
84.79 MiB
Veri kümesi boyutu :
98.43 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Evet
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.002 |
- Özellik yapısı :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': float32,
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(17,), dtype=float32),
'reward': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
adımlar | veri kümesi | |||
adımlar/eylem | tensör | (6,) | şamandıra32 | |
adımlar/indirim | tensör | şamandıra32 | ||
adımlar/ilk_ilk | tensör | bool | ||
adımlar/is_last | tensör | bool | ||
adımlar/is_terminali | tensör | bool | ||
adımlar/gözlem | tensör | (17,) | şamandıra32 | |
adımlar/ödül | tensör | şamandıra32 |
- Örnekler ( tfds.as_dataframe ):
d4rl_mujoco_halfcheetah/v1-uzmanı
İndirme boyutu :
146.94 MiB
Veri kümesi boyutu :
451.88 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Özellik yapısı :
FeaturesDict({
'algorithm': string,
'iteration': int32,
'policy': FeaturesDict({
'fc0': FeaturesDict({
'bias': Tensor(shape=(256,), dtype=float32),
'weight': Tensor(shape=(256, 17), dtype=float32),
}),
'fc1': FeaturesDict({
'bias': Tensor(shape=(256,), dtype=float32),
'weight': Tensor(shape=(256, 256), dtype=float32),
}),
'last_fc': FeaturesDict({
'bias': Tensor(shape=(6,), dtype=float32),
'weight': Tensor(shape=(6, 256), dtype=float32),
}),
'last_fc_log_std': FeaturesDict({
'bias': Tensor(shape=(6,), dtype=float32),
'weight': Tensor(shape=(6, 256), dtype=float32),
}),
'nonlinearity': string,
'output_distribution': string,
}),
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': float32,
'infos': FeaturesDict({
'action_log_probs': float32,
'qpos': Tensor(shape=(9,), dtype=float32),
'qvel': Tensor(shape=(9,), dtype=float32),
}),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(17,), dtype=float32),
'reward': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
algoritma | tensör | sicim | ||
yineleme | tensör | int32 | ||
politika | ÖzelliklerDict | |||
ilke/fc0 | ÖzelliklerDict | |||
politika/fc0/bias | tensör | (256,) | şamandıra32 | |
ilke/fc0/ağırlık | tensör | (256, 17) | şamandıra32 | |
ilke/fc1 | ÖzelliklerDict | |||
politika/fc1/önyargı | tensör | (256,) | şamandıra32 | |
ilke/fc1/ağırlık | tensör | (256, 256) | şamandıra32 | |
ilke/last_fc | ÖzelliklerDict | |||
politika/last_fc/bias | tensör | (6,) | şamandıra32 | |
ilke/last_fc/ağırlık | tensör | (6, 256) | şamandıra32 | |
ilke/last_fc_log_std | ÖzelliklerDict | |||
ilke/last_fc_log_std/bias | tensör | (6,) | şamandıra32 | |
ilke/last_fc_log_std/ağırlık | tensör | (6, 256) | şamandıra32 | |
ilke/doğrusal olmama | tensör | sicim | ||
politika/çıktı_dağıtımı | tensör | sicim | ||
adımlar | veri kümesi | |||
adımlar/eylem | tensör | (6,) | şamandıra32 | |
adımlar/indirim | tensör | şamandıra32 | ||
adımlar/bilgiler | ÖzelliklerDict | |||
adımlar/bilgiler/action_log_probs | tensör | şamandıra32 | ||
adımlar/bilgiler/qpos | tensör | (9,) | şamandıra32 | |
adımlar/bilgiler/qvel | tensör | (9,) | şamandıra32 | |
adımlar/ilk_ilk | tensör | bool | ||
adımlar/is_last | tensör | bool | ||
adımlar/is_terminali | tensör | bool | ||
adımlar/gözlem | tensör | (17,) | şamandıra32 | |
adımlar/ödül | tensör | şamandıra32 |
- Örnekler ( tfds.as_dataframe ):
d4rl_mujoco_halfcheetah/v1-orta
İndirme boyutu :
146.65 MiB
Veri kümesi boyutu :
451.88 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Özellik yapısı :
FeaturesDict({
'algorithm': string,
'iteration': int32,
'policy': FeaturesDict({
'fc0': FeaturesDict({
'bias': Tensor(shape=(256,), dtype=float32),
'weight': Tensor(shape=(256, 17), dtype=float32),
}),
'fc1': FeaturesDict({
'bias': Tensor(shape=(256,), dtype=float32),
'weight': Tensor(shape=(256, 256), dtype=float32),
}),
'last_fc': FeaturesDict({
'bias': Tensor(shape=(6,), dtype=float32),
'weight': Tensor(shape=(6, 256), dtype=float32),
}),
'last_fc_log_std': FeaturesDict({
'bias': Tensor(shape=(6,), dtype=float32),
'weight': Tensor(shape=(6, 256), dtype=float32),
}),
'nonlinearity': string,
'output_distribution': string,
}),
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': float32,
'infos': FeaturesDict({
'action_log_probs': float32,
'qpos': Tensor(shape=(9,), dtype=float32),
'qvel': Tensor(shape=(9,), dtype=float32),
}),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(17,), dtype=float32),
'reward': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
algoritma | tensör | sicim | ||
yineleme | tensör | int32 | ||
politika | ÖzelliklerDict | |||
ilke/fc0 | ÖzelliklerDict | |||
politika/fc0/bias | tensör | (256,) | şamandıra32 | |
ilke/fc0/ağırlık | tensör | (256, 17) | şamandıra32 | |
ilke/fc1 | ÖzelliklerDict | |||
politika/fc1/önyargı | tensör | (256,) | şamandıra32 | |
ilke/fc1/ağırlık | tensör | (256, 256) | şamandıra32 | |
ilke/last_fc | ÖzelliklerDict | |||
politika/last_fc/bias | tensör | (6,) | şamandıra32 | |
ilke/last_fc/ağırlık | tensör | (6, 256) | şamandıra32 | |
ilke/last_fc_log_std | ÖzelliklerDict | |||
ilke/last_fc_log_std/bias | tensör | (6,) | şamandıra32 | |
ilke/last_fc_log_std/ağırlık | tensör | (6, 256) | şamandıra32 | |
ilke/doğrusal olmama | tensör | sicim | ||
politika/çıktı_dağıtımı | tensör | sicim | ||
adımlar | veri kümesi | |||
adımlar/eylem | tensör | (6,) | şamandıra32 | |
adımlar/indirim | tensör | şamandıra32 | ||
adımlar/bilgiler | ÖzelliklerDict | |||
adımlar/bilgiler/action_log_probs | tensör | şamandıra32 | ||
adımlar/bilgiler/qpos | tensör | (9,) | şamandıra32 | |
adımlar/bilgiler/qvel | tensör | (9,) | şamandıra32 | |
adımlar/ilk_ilk | tensör | bool | ||
adımlar/is_last | tensör | bool | ||
adımlar/is_terminali | tensör | bool | ||
adımlar/gözlem | tensör | (17,) | şamandıra32 | |
adımlar/ödül | tensör | şamandıra32 |
- Örnekler ( tfds.as_dataframe ):
d4rl_mujoco_halfcheetah/v1-orta-uzman
İndirme boyutu :
293.00 MiB
Veri kümesi boyutu :
342.37 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 2.000 |
- Özellik yapısı :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': float32,
'infos': FeaturesDict({
'action_log_probs': float32,
'qpos': Tensor(shape=(9,), dtype=float32),
'qvel': Tensor(shape=(9,), dtype=float32),
}),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(17,), dtype=float32),
'reward': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
adımlar | veri kümesi | |||
adımlar/eylem | tensör | (6,) | şamandıra32 | |
adımlar/indirim | tensör | şamandıra32 | ||
adımlar/bilgiler | ÖzelliklerDict | |||
adımlar/bilgiler/action_log_probs | tensör | şamandıra32 | ||
adımlar/bilgiler/qpos | tensör | (9,) | şamandıra32 | |
adımlar/bilgiler/qvel | tensör | (9,) | şamandıra32 | |
adımlar/ilk_ilk | tensör | bool | ||
adımlar/is_last | tensör | bool | ||
adımlar/is_terminali | tensör | bool | ||
adımlar/gözlem | tensör | (17,) | şamandıra32 | |
adımlar/ödül | tensör | şamandıra32 |
- Örnekler ( tfds.as_dataframe ):
d4rl_mujoco_halfcheetah/v1-orta-tekrar oynatma
İndirme boyutu :
57.68 MiB
Veri kümesi boyutu :
34.59 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Evet
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 202 |
- Özellik yapısı :
FeaturesDict({
'algorithm': string,
'iteration': int32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float64),
'discount': float64,
'infos': FeaturesDict({
'action_log_probs': float64,
'qpos': Tensor(shape=(9,), dtype=float64),
'qvel': Tensor(shape=(9,), dtype=float64),
}),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(17,), dtype=float64),
'reward': float64,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
algoritma | tensör | sicim | ||
yineleme | tensör | int32 | ||
adımlar | veri kümesi | |||
adımlar/eylem | tensör | (6,) | şamandıra64 | |
adımlar/indirim | tensör | şamandıra64 | ||
adımlar/bilgiler | ÖzelliklerDict | |||
adımlar/bilgiler/action_log_probs | tensör | şamandıra64 | ||
adımlar/bilgiler/qpos | tensör | (9,) | şamandıra64 | |
adımlar/bilgiler/qvel | tensör | (9,) | şamandıra64 | |
adımlar/ilk_ilk | tensör | bool | ||
adımlar/is_last | tensör | bool | ||
adımlar/is_terminali | tensör | bool | ||
adımlar/gözlem | tensör | (17,) | şamandıra64 | |
adımlar/ödül | tensör | şamandıra64 |
- Örnekler ( tfds.as_dataframe ):
d4rl_mujoco_halfcheetah/v1-full-replay
İndirme boyutu :
285.01 MiB
Veri kümesi boyutu :
171.22 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Yalnızca
shuffle_files=False
(tren) olduğundabölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Özellik yapısı :
FeaturesDict({
'algorithm': string,
'iteration': int32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float64),
'discount': float64,
'infos': FeaturesDict({
'action_log_probs': float64,
'qpos': Tensor(shape=(9,), dtype=float64),
'qvel': Tensor(shape=(9,), dtype=float64),
}),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(17,), dtype=float64),
'reward': float64,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
algoritma | tensör | sicim | ||
yineleme | tensör | int32 | ||
adımlar | veri kümesi | |||
adımlar/eylem | tensör | (6,) | şamandıra64 | |
adımlar/indirim | tensör | şamandıra64 | ||
adımlar/bilgiler | ÖzelliklerDict | |||
adımlar/bilgiler/action_log_probs | tensör | şamandıra64 | ||
adımlar/bilgiler/qpos | tensör | (9,) | şamandıra64 | |
adımlar/bilgiler/qvel | tensör | (9,) | şamandıra64 | |
adımlar/ilk_ilk | tensör | bool | ||
adımlar/is_last | tensör | bool | ||
adımlar/is_terminali | tensör | bool | ||
adımlar/gözlem | tensör | (17,) | şamandıra64 | |
adımlar/ödül | tensör | şamandıra64 |
- Örnekler ( tfds.as_dataframe ):
d4rl_mujoco_halfcheetah/v1-rasgele
İndirme boyutu :
145.19 MiB
Veri kümesi boyutu :
171.18 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Yalnızca
shuffle_files=False
(tren) olduğundabölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Özellik yapısı :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': float32,
'infos': FeaturesDict({
'action_log_probs': float32,
'qpos': Tensor(shape=(9,), dtype=float32),
'qvel': Tensor(shape=(9,), dtype=float32),
}),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(17,), dtype=float32),
'reward': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
adımlar | veri kümesi | |||
adımlar/eylem | tensör | (6,) | şamandıra32 | |
adımlar/indirim | tensör | şamandıra32 | ||
adımlar/bilgiler | ÖzelliklerDict | |||
adımlar/bilgiler/action_log_probs | tensör | şamandıra32 | ||
adımlar/bilgiler/qpos | tensör | (9,) | şamandıra32 | |
adımlar/bilgiler/qvel | tensör | (9,) | şamandıra32 | |
adımlar/ilk_ilk | tensör | bool | ||
adımlar/is_last | tensör | bool | ||
adımlar/is_terminali | tensör | bool | ||
adımlar/gözlem | tensör | (17,) | şamandıra32 | |
adımlar/ödül | tensör | şamandıra32 |
- Örnekler ( tfds.as_dataframe ):
d4rl_mujoco_halfcheetah/v2-uzmanı
İndirme boyutu :
226.46 MiB
Veri kümesi boyutu :
451.88 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Özellik yapısı :
FeaturesDict({
'algorithm': string,
'iteration': int32,
'policy': FeaturesDict({
'fc0': FeaturesDict({
'bias': Tensor(shape=(256,), dtype=float32),
'weight': Tensor(shape=(256, 17), dtype=float32),
}),
'fc1': FeaturesDict({
'bias': Tensor(shape=(256,), dtype=float32),
'weight': Tensor(shape=(256, 256), dtype=float32),
}),
'last_fc': FeaturesDict({
'bias': Tensor(shape=(6,), dtype=float32),
'weight': Tensor(shape=(6, 256), dtype=float32),
}),
'last_fc_log_std': FeaturesDict({
'bias': Tensor(shape=(6,), dtype=float32),
'weight': Tensor(shape=(6, 256), dtype=float32),
}),
'nonlinearity': string,
'output_distribution': string,
}),
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': float32,
'infos': FeaturesDict({
'action_log_probs': float64,
'qpos': Tensor(shape=(9,), dtype=float64),
'qvel': Tensor(shape=(9,), dtype=float64),
}),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(17,), dtype=float32),
'reward': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
algoritma | tensör | sicim | ||
yineleme | tensör | int32 | ||
politika | ÖzelliklerDict | |||
ilke/fc0 | ÖzelliklerDict | |||
politika/fc0/bias | tensör | (256,) | şamandıra32 | |
ilke/fc0/ağırlık | tensör | (256, 17) | şamandıra32 | |
ilke/fc1 | ÖzelliklerDict | |||
politika/fc1/önyargı | tensör | (256,) | şamandıra32 | |
ilke/fc1/ağırlık | tensör | (256, 256) | şamandıra32 | |
ilke/last_fc | ÖzelliklerDict | |||
politika/last_fc/bias | tensör | (6,) | şamandıra32 | |
ilke/last_fc/ağırlık | tensör | (6, 256) | şamandıra32 | |
ilke/last_fc_log_std | ÖzelliklerDict | |||
ilke/last_fc_log_std/bias | tensör | (6,) | şamandıra32 | |
ilke/last_fc_log_std/ağırlık | tensör | (6, 256) | şamandıra32 | |
ilke/doğrusal olmama | tensör | sicim | ||
politika/çıktı_dağıtımı | tensör | sicim | ||
adımlar | veri kümesi | |||
adımlar/eylem | tensör | (6,) | şamandıra32 | |
adımlar/indirim | tensör | şamandıra32 | ||
adımlar/bilgiler | ÖzelliklerDict | |||
adımlar/bilgiler/action_log_probs | tensör | şamandıra64 | ||
adımlar/bilgiler/qpos | tensör | (9,) | şamandıra64 | |
adımlar/bilgiler/qvel | tensör | (9,) | şamandıra64 | |
adımlar/ilk_ilk | tensör | bool | ||
adımlar/is_last | tensör | bool | ||
adımlar/is_terminali | tensör | bool | ||
adımlar/gözlem | tensör | (17,) | şamandıra32 | |
adımlar/ödül | tensör | şamandıra32 |
- Örnekler ( tfds.as_dataframe ):
d4rl_mujoco_halfcheetah/v2-full-replay
İndirme boyutu :
277.88 MiB
Veri kümesi boyutu :
171.22 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Yalnızca
shuffle_files=False
(tren) olduğundabölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Özellik yapısı :
FeaturesDict({
'algorithm': string,
'iteration': int32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': float32,
'infos': FeaturesDict({
'action_log_probs': float64,
'qpos': Tensor(shape=(9,), dtype=float64),
'qvel': Tensor(shape=(9,), dtype=float64),
}),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(17,), dtype=float32),
'reward': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
algoritma | tensör | sicim | ||
yineleme | tensör | int32 | ||
adımlar | veri kümesi | |||
adımlar/eylem | tensör | (6,) | şamandıra32 | |
adımlar/indirim | tensör | şamandıra32 | ||
adımlar/bilgiler | ÖzelliklerDict | |||
adımlar/bilgiler/action_log_probs | tensör | şamandıra64 | ||
adımlar/bilgiler/qpos | tensör | (9,) | şamandıra64 | |
adımlar/bilgiler/qvel | tensör | (9,) | şamandıra64 | |
adımlar/ilk_ilk | tensör | bool | ||
adımlar/is_last | tensör | bool | ||
adımlar/is_terminali | tensör | bool | ||
adımlar/gözlem | tensör | (17,) | şamandıra32 | |
adımlar/ödül | tensör | şamandıra32 |
- Örnekler ( tfds.as_dataframe ):
d4rl_mujoco_halfcheetah/v2-orta
İndirme boyutu :
226.71 MiB
Veri kümesi boyutu :
451.88 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Özellik yapısı :
FeaturesDict({
'algorithm': string,
'iteration': int32,
'policy': FeaturesDict({
'fc0': FeaturesDict({
'bias': Tensor(shape=(256,), dtype=float32),
'weight': Tensor(shape=(256, 17), dtype=float32),
}),
'fc1': FeaturesDict({
'bias': Tensor(shape=(256,), dtype=float32),
'weight': Tensor(shape=(256, 256), dtype=float32),
}),
'last_fc': FeaturesDict({
'bias': Tensor(shape=(6,), dtype=float32),
'weight': Tensor(shape=(6, 256), dtype=float32),
}),
'last_fc_log_std': FeaturesDict({
'bias': Tensor(shape=(6,), dtype=float32),
'weight': Tensor(shape=(6, 256), dtype=float32),
}),
'nonlinearity': string,
'output_distribution': string,
}),
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': float32,
'infos': FeaturesDict({
'action_log_probs': float64,
'qpos': Tensor(shape=(9,), dtype=float64),
'qvel': Tensor(shape=(9,), dtype=float64),
}),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(17,), dtype=float32),
'reward': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
algoritma | tensör | sicim | ||
yineleme | tensör | int32 | ||
politika | ÖzelliklerDict | |||
ilke/fc0 | ÖzelliklerDict | |||
politika/fc0/bias | tensör | (256,) | şamandıra32 | |
ilke/fc0/ağırlık | tensör | (256, 17) | şamandıra32 | |
ilke/fc1 | ÖzelliklerDict | |||
politika/fc1/önyargı | tensör | (256,) | şamandıra32 | |
ilke/fc1/ağırlık | tensör | (256, 256) | şamandıra32 | |
ilke/last_fc | ÖzelliklerDict | |||
politika/last_fc/bias | tensör | (6,) | şamandıra32 | |
ilke/last_fc/ağırlık | tensör | (6, 256) | şamandıra32 | |
ilke/last_fc_log_std | ÖzelliklerDict | |||
ilke/last_fc_log_std/bias | tensör | (6,) | şamandıra32 | |
ilke/last_fc_log_std/ağırlık | tensör | (6, 256) | şamandıra32 | |
ilke/doğrusal olmama | tensör | sicim | ||
politika/çıktı_dağıtımı | tensör | sicim | ||
adımlar | veri kümesi | |||
adımlar/eylem | tensör | (6,) | şamandıra32 | |
adımlar/indirim | tensör | şamandıra32 | ||
adımlar/bilgiler | ÖzelliklerDict | |||
adımlar/bilgiler/action_log_probs | tensör | şamandıra64 | ||
adımlar/bilgiler/qpos | tensör | (9,) | şamandıra64 | |
adımlar/bilgiler/qvel | tensör | (9,) | şamandıra64 | |
adımlar/ilk_ilk | tensör | bool | ||
adımlar/is_last | tensör | bool | ||
adımlar/is_terminali | tensör | bool | ||
adımlar/gözlem | tensör | (17,) | şamandıra32 | |
adımlar/ödül | tensör | şamandıra32 |
- Örnekler ( tfds.as_dataframe ):
d4rl_mujoco_halfcheetah/v2-orta-uzman
İndirme boyutu :
452.58 MiB
Veri kümesi boyutu :
342.37 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 2.000 |
- Özellik yapısı :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': float32,
'infos': FeaturesDict({
'action_log_probs': float64,
'qpos': Tensor(shape=(9,), dtype=float64),
'qvel': Tensor(shape=(9,), dtype=float64),
}),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(17,), dtype=float32),
'reward': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
adımlar | veri kümesi | |||
adımlar/eylem | tensör | (6,) | şamandıra32 | |
adımlar/indirim | tensör | şamandıra32 | ||
adımlar/bilgiler | ÖzelliklerDict | |||
adımlar/bilgiler/action_log_probs | tensör | şamandıra64 | ||
adımlar/bilgiler/qpos | tensör | (9,) | şamandıra64 | |
adımlar/bilgiler/qvel | tensör | (9,) | şamandıra64 | |
adımlar/ilk_ilk | tensör | bool | ||
adımlar/is_last | tensör | bool | ||
adımlar/is_terminali | tensör | bool | ||
adımlar/gözlem | tensör | (17,) | şamandıra32 | |
adımlar/ödül | tensör | şamandıra32 |
- Örnekler ( tfds.as_dataframe ):
d4rl_mujoco_halfcheetah/v2-orta-tekrar oynatma
İndirme boyutu :
56.69 MiB
Veri kümesi boyutu :
34.59 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Evet
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 202 |
- Özellik yapısı :
FeaturesDict({
'algorithm': string,
'iteration': int32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': float32,
'infos': FeaturesDict({
'action_log_probs': float64,
'qpos': Tensor(shape=(9,), dtype=float64),
'qvel': Tensor(shape=(9,), dtype=float64),
}),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(17,), dtype=float32),
'reward': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
algoritma | tensör | sicim | ||
yineleme | tensör | int32 | ||
adımlar | veri kümesi | |||
adımlar/eylem | tensör | (6,) | şamandıra32 | |
adımlar/indirim | tensör | şamandıra32 | ||
adımlar/bilgiler | ÖzelliklerDict | |||
adımlar/bilgiler/action_log_probs | tensör | şamandıra64 | ||
adımlar/bilgiler/qpos | tensör | (9,) | şamandıra64 | |
adımlar/bilgiler/qvel | tensör | (9,) | şamandıra64 | |
adımlar/ilk_ilk | tensör | bool | ||
adımlar/is_last | tensör | bool | ||
adımlar/is_terminali | tensör | bool | ||
adımlar/gözlem | tensör | (17,) | şamandıra32 | |
adımlar/ödül | tensör | şamandıra32 |
- Örnekler ( tfds.as_dataframe ):
d4rl_mujoco_halfcheetah/v2-rasgele
İndirme boyutu :
226.34 MiB
Veri kümesi boyutu :
171.18 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Yalnızca
shuffle_files=False
(tren) olduğundabölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.000 |
- Özellik yapısı :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': float32,
'infos': FeaturesDict({
'action_log_probs': float64,
'qpos': Tensor(shape=(9,), dtype=float64),
'qvel': Tensor(shape=(9,), dtype=float64),
}),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(17,), dtype=float32),
'reward': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
adımlar | veri kümesi | |||
adımlar/eylem | tensör | (6,) | şamandıra32 | |
adımlar/indirim | tensör | şamandıra32 | ||
adımlar/bilgiler | ÖzelliklerDict | |||
adımlar/bilgiler/action_log_probs | tensör | şamandıra64 | ||
adımlar/bilgiler/qpos | tensör | (9,) | şamandıra64 | |
adımlar/bilgiler/qvel | tensör | (9,) | şamandıra64 | |
adımlar/ilk_ilk | tensör | bool | ||
adımlar/is_last | tensör | bool | ||
adımlar/is_terminali | tensör | bool | ||
adımlar/gözlem | tensör | (17,) | şamandıra32 | |
adımlar/ödül | tensör | şamandıra32 |
- Örnekler ( tfds.as_dataframe ):