- Açıklama :
D4RL, çevrimdışı pekiştirmeli öğrenim için açık kaynaklı bir kıyaslamadır. Eğitim ve kıyaslama algoritmaları için standartlaştırılmış ortamlar ve veri kümeleri sağlar.
Veri kümeleri, adımları ve bölümleri temsil etmek için RLDS biçimini izler.
Yapılandırma açıklaması : https://github.com/rail-berkeley/d4rl/wiki/Tasks#adroit adresinde görev ve sürümleri hakkında daha fazla ayrıntı görün
Ana Sayfa : https://sites.google.com/view/d4rl/home
Kaynak kodu :
tfds.d4rl.d4rl_adroit_relocate.D4rlAdroitRelocate
sürümler :
-
1.0.0
: İlk sürüm. -
1.1.0
(varsayılan): is_last eklendi.
-
Denetlenen anahtarlar (Bkz
as_supervised
doc ):None
Şekil ( tfds.show_examples ): Desteklenmiyor.
Alıntı :
@misc{fu2020d4rl,
title={D4RL: Datasets for Deep Data-Driven Reinforcement Learning},
author={Justin Fu and Aviral Kumar and Ofir Nachum and George Tucker and Sergey Levine},
year={2020},
eprint={2004.07219},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
d4rl_adroit_relocate/v0-human (varsayılan yapılandırma)
İndirme boyutu :
4.87 MiB
Veri kümesi boyutu :
5.48 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Evet
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 60 |
- Özellik yapısı :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(30,), dtype=float32),
'discount': float32,
'infos': FeaturesDict({
'qpos': Tensor(shape=(36,), dtype=float32),
'qvel': Tensor(shape=(36,), dtype=float32),
}),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(39,), dtype=float32),
'reward': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
adımlar | veri kümesi | |||
adımlar/eylem | tensör | (30,) | şamandıra32 | |
adımlar/indirim | tensör | şamandıra32 | ||
adımlar/bilgiler | ÖzelliklerDict | |||
adımlar/bilgiler/qpos | tensör | (36,) | şamandıra32 | |
adımlar/bilgiler/qvel | tensör | (36,) | şamandıra32 | |
adımlar/ilk_ilk | tensör | bool | ||
adımlar/is_last | tensör | bool | ||
adımlar/is_terminali | tensör | bool | ||
adımlar/gözlem | tensör | (39,) | şamandıra32 | |
adımlar/ödül | tensör | şamandıra32 |
- Örnekler ( tfds.as_dataframe ):
d4rl_adroit_relocate/v0-klonlanmış
İndirme boyutu :
647.11 MiB
Veri kümesi boyutu :
550.50 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 5.519 |
- Özellik yapısı :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(30,), dtype=float32),
'discount': float64,
'infos': FeaturesDict({
'qpos': Tensor(shape=(36,), dtype=float64),
'qvel': Tensor(shape=(36,), dtype=float64),
}),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(39,), dtype=float64),
'reward': float64,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
adımlar | veri kümesi | |||
adımlar/eylem | tensör | (30,) | şamandıra32 | |
adımlar/indirim | tensör | şamandıra64 | ||
adımlar/bilgiler | ÖzelliklerDict | |||
adımlar/bilgiler/qpos | tensör | (36,) | şamandıra64 | |
adımlar/bilgiler/qvel | tensör | (36,) | şamandıra64 | |
adımlar/ilk_ilk | tensör | bool | ||
adımlar/is_last | tensör | bool | ||
adımlar/is_terminali | tensör | bool | ||
adımlar/gözlem | tensör | (39,) | şamandıra64 | |
adımlar/ödül | tensör | şamandıra64 |
- Örnekler ( tfds.as_dataframe ):
d4rl_adroit_relocate/v0-uzmanı
İndirme boyutu :
581.53 MiB
Veri kümesi boyutu :
778.97 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 5.000 |
- Özellik yapısı :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(30,), dtype=float32),
'discount': float32,
'infos': FeaturesDict({
'action_logstd': Tensor(shape=(30,), dtype=float32),
'action_mean': Tensor(shape=(30,), dtype=float32),
'qpos': Tensor(shape=(36,), dtype=float32),
'qvel': Tensor(shape=(36,), dtype=float32),
}),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(39,), dtype=float32),
'reward': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
adımlar | veri kümesi | |||
adımlar/eylem | tensör | (30,) | şamandıra32 | |
adımlar/indirim | tensör | şamandıra32 | ||
adımlar/bilgiler | ÖzelliklerDict | |||
adımlar/bilgiler/action_logstd | tensör | (30,) | şamandıra32 | |
adımlar/bilgiler/eylem_mean | tensör | (30,) | şamandıra32 | |
adımlar/bilgiler/qpos | tensör | (36,) | şamandıra32 | |
adımlar/bilgiler/qvel | tensör | (36,) | şamandıra32 | |
adımlar/ilk_ilk | tensör | bool | ||
adımlar/is_last | tensör | bool | ||
adımlar/is_terminali | tensör | bool | ||
adımlar/gözlem | tensör | (39,) | şamandıra32 | |
adımlar/ödül | tensör | şamandıra32 |
- Örnekler ( tfds.as_dataframe ):
d4rl_adroit_relocate/v1-insan
İndirme boyutu :
5.92 MiB
Veri kümesi boyutu :
6.94 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Evet
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 25 |
- Özellik yapısı :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(30,), dtype=float32),
'discount': float32,
'infos': FeaturesDict({
'hand_qpos': Tensor(shape=(30,), dtype=float32),
'obj_pos': Tensor(shape=(3,), dtype=float32),
'palm_pos': Tensor(shape=(3,), dtype=float32),
'qpos': Tensor(shape=(36,), dtype=float32),
'qvel': Tensor(shape=(36,), dtype=float32),
'target_pos': Tensor(shape=(3,), dtype=float32),
}),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(39,), dtype=float32),
'reward': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
adımlar | veri kümesi | |||
adımlar/eylem | tensör | (30,) | şamandıra32 | |
adımlar/indirim | tensör | şamandıra32 | ||
adımlar/bilgiler | ÖzelliklerDict | |||
adımlar/bilgiler/hand_qpos | tensör | (30,) | şamandıra32 | |
adımlar/bilgiler/obj_pos | tensör | (3,) | şamandıra32 | |
adımlar/bilgiler/palm_pos | tensör | (3,) | şamandıra32 | |
adımlar/bilgiler/qpos | tensör | (36,) | şamandıra32 | |
adımlar/bilgiler/qvel | tensör | (36,) | şamandıra32 | |
adımlar/bilgiler/target_pos | tensör | (3,) | şamandıra32 | |
adımlar/ilk_ilk | tensör | bool | ||
adımlar/is_last | tensör | bool | ||
adımlar/is_terminali | tensör | bool | ||
adımlar/gözlem | tensör | (39,) | şamandıra32 | |
adımlar/ödül | tensör | şamandıra32 |
- Örnekler ( tfds.as_dataframe ):
d4rl_adroit_relocate/v1-klonlanmış
İndirme boyutu :
554.39 MiB
Veri kümesi boyutu :
1.86 GiB
Otomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 3.758 |
- Özellik yapısı :
FeaturesDict({
'algorithm': string,
'policy': FeaturesDict({
'fc0': FeaturesDict({
'bias': Tensor(shape=(256,), dtype=float32),
'weight': Tensor(shape=(39, 256), dtype=float32),
}),
'fc1': FeaturesDict({
'bias': Tensor(shape=(256,), dtype=float32),
'weight': Tensor(shape=(256, 256), dtype=float32),
}),
'last_fc': FeaturesDict({
'bias': Tensor(shape=(30,), dtype=float32),
'weight': Tensor(shape=(256, 30), dtype=float32),
}),
'nonlinearity': string,
'output_distribution': string,
}),
'steps': Dataset({
'action': Tensor(shape=(30,), dtype=float32),
'discount': float32,
'infos': FeaturesDict({
'hand_qpos': Tensor(shape=(30,), dtype=float32),
'obj_pos': Tensor(shape=(3,), dtype=float32),
'palm_pos': Tensor(shape=(3,), dtype=float32),
'qpos': Tensor(shape=(36,), dtype=float32),
'qvel': Tensor(shape=(36,), dtype=float32),
'target_pos': Tensor(shape=(3,), dtype=float32),
}),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(39,), dtype=float32),
'reward': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
algoritma | tensör | sicim | ||
politika | ÖzelliklerDict | |||
ilke/fc0 | ÖzelliklerDict | |||
politika/fc0/bias | tensör | (256,) | şamandıra32 | |
ilke/fc0/ağırlık | tensör | (39, 256) | şamandıra32 | |
ilke/fc1 | ÖzelliklerDict | |||
politika/fc1/önyargı | tensör | (256,) | şamandıra32 | |
ilke/fc1/ağırlık | tensör | (256, 256) | şamandıra32 | |
ilke/last_fc | ÖzelliklerDict | |||
politika/last_fc/bias | tensör | (30,) | şamandıra32 | |
ilke/last_fc/ağırlık | tensör | (256, 30) | şamandıra32 | |
ilke/doğrusal olmama | tensör | sicim | ||
politika/çıktı_dağıtımı | tensör | sicim | ||
adımlar | veri kümesi | |||
adımlar/eylem | tensör | (30,) | şamandıra32 | |
adımlar/indirim | tensör | şamandıra32 | ||
adımlar/bilgiler | ÖzelliklerDict | |||
adımlar/bilgiler/hand_qpos | tensör | (30,) | şamandıra32 | |
adımlar/bilgiler/obj_pos | tensör | (3,) | şamandıra32 | |
adımlar/bilgiler/palm_pos | tensör | (3,) | şamandıra32 | |
adımlar/bilgiler/qpos | tensör | (36,) | şamandıra32 | |
adımlar/bilgiler/qvel | tensör | (36,) | şamandıra32 | |
adımlar/bilgiler/target_pos | tensör | (3,) | şamandıra32 | |
adımlar/ilk_ilk | tensör | bool | ||
adımlar/is_last | tensör | bool | ||
adımlar/is_terminali | tensör | bool | ||
adımlar/gözlem | tensör | (39,) | şamandıra32 | |
adımlar/ödül | tensör | şamandıra32 |
- Örnekler ( tfds.as_dataframe ):
d4rl_adroit_relocate/v1-uzmanı
İndirme boyutu :
682.47 MiB
Veri kümesi boyutu :
1012.49 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 5.000 |
- Özellik yapısı :
FeaturesDict({
'algorithm': string,
'policy': FeaturesDict({
'fc0': FeaturesDict({
'bias': Tensor(shape=(32,), dtype=float32),
'weight': Tensor(shape=(32, 39), dtype=float32),
}),
'fc1': FeaturesDict({
'bias': Tensor(shape=(32,), dtype=float32),
'weight': Tensor(shape=(32, 32), dtype=float32),
}),
'last_fc': FeaturesDict({
'bias': Tensor(shape=(30,), dtype=float32),
'weight': Tensor(shape=(30, 32), dtype=float32),
}),
'last_fc_log_std': FeaturesDict({
'bias': Tensor(shape=(30,), dtype=float32),
'weight': Tensor(shape=(30, 32), dtype=float32),
}),
'nonlinearity': string,
'output_distribution': string,
}),
'steps': Dataset({
'action': Tensor(shape=(30,), dtype=float32),
'discount': float32,
'infos': FeaturesDict({
'action_log_std': Tensor(shape=(30,), dtype=float32),
'action_mean': Tensor(shape=(30,), dtype=float32),
'hand_qpos': Tensor(shape=(30,), dtype=float32),
'obj_pos': Tensor(shape=(3,), dtype=float32),
'palm_pos': Tensor(shape=(3,), dtype=float32),
'qpos': Tensor(shape=(36,), dtype=float32),
'qvel': Tensor(shape=(36,), dtype=float32),
'target_pos': Tensor(shape=(3,), dtype=float32),
}),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(39,), dtype=float32),
'reward': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
algoritma | tensör | sicim | ||
politika | ÖzelliklerDict | |||
ilke/fc0 | ÖzelliklerDict | |||
politika/fc0/bias | tensör | (32,) | şamandıra32 | |
ilke/fc0/ağırlık | tensör | (32, 39) | şamandıra32 | |
ilke/fc1 | ÖzelliklerDict | |||
politika/fc1/önyargı | tensör | (32,) | şamandıra32 | |
ilke/fc1/ağırlık | tensör | (32, 32) | şamandıra32 | |
ilke/last_fc | ÖzelliklerDict | |||
politika/last_fc/bias | tensör | (30,) | şamandıra32 | |
ilke/last_fc/ağırlık | tensör | (30, 32) | şamandıra32 | |
ilke/last_fc_log_std | ÖzelliklerDict | |||
ilke/last_fc_log_std/bias | tensör | (30,) | şamandıra32 | |
ilke/last_fc_log_std/ağırlık | tensör | (30, 32) | şamandıra32 | |
ilke/doğrusal olmama | tensör | sicim | ||
politika/çıktı_dağıtımı | tensör | sicim | ||
adımlar | veri kümesi | |||
adımlar/eylem | tensör | (30,) | şamandıra32 | |
adımlar/indirim | tensör | şamandıra32 | ||
adımlar/bilgiler | ÖzelliklerDict | |||
adımlar/bilgiler/action_log_std | tensör | (30,) | şamandıra32 | |
adımlar/bilgiler/eylem_mean | tensör | (30,) | şamandıra32 | |
adımlar/bilgiler/hand_qpos | tensör | (30,) | şamandıra32 | |
adımlar/bilgiler/obj_pos | tensör | (3,) | şamandıra32 | |
adımlar/bilgiler/palm_pos | tensör | (3,) | şamandıra32 | |
adımlar/bilgiler/qpos | tensör | (36,) | şamandıra32 | |
adımlar/bilgiler/qvel | tensör | (36,) | şamandıra32 | |
adımlar/bilgiler/target_pos | tensör | (3,) | şamandıra32 | |
adımlar/ilk_ilk | tensör | bool | ||
adımlar/is_last | tensör | bool | ||
adımlar/is_terminali | tensör | bool | ||
adımlar/gözlem | tensör | (39,) | şamandıra32 | |
adımlar/ödül | tensör | şamandıra32 |
- Örnekler ( tfds.as_dataframe ):