TFDS artık Kruvasan 🥐 formatını destekliyor! Daha fazlasını öğrenmek için belgeleri okuyun.

Bu sayfa, Cloud Translation API ile çevrilmiştir.

d4rl_mujoco_halfcheetah

Tanım :

D4RL, çevrimdışı takviyeli öğrenim için açık kaynaklı bir kıyaslamadır. Eğitim ve kıyaslama algoritmaları için standartlaştırılmış ortamlar ve veri kümeleri sağlar.

Veri kümeleri, adımları ve bölümleri temsil etmek için RLDS formatını takip eder.

Yapılandırma açıklaması : https://github.com/rail-berkeley/d4rl/wiki/Tasks#gym adresinde görev ve sürümleri hakkında daha fazla ayrıntıya bakın
Ana sayfa : https://sites.google.com/view/d4rl-anonymous
Kaynak kodu : tfds.d4rl.d4rl_mujoco_halfcheetah.D4rlMujocoHalfcheetah
Sürümler :
- 1.0.0 : İlk sürüm.
- 1.0.1 : Bölüm ve adım meta verileri desteği ve ödül şeklinin tüm yapılandırmalarda birleştirilmesi.
- 1.1.0 : is_last eklendi.
- 1.2.0 (varsayılan): Bir sonraki gözlemi dikkate alacak şekilde güncellendi.
Denetlenen anahtarlar ( as_supervised belgesine bakın): None
Şekil ( tfds.show_examples ): Desteklenmiyor.
Alıntı :

@misc{fu2020d4rl,
    title={D4RL: Datasets for Deep Data-Driven Reinforcement Learning},
    author={Justin Fu and Aviral Kumar and Ofir Nachum and George Tucker and Sergey Levine},
    year={2020},
    eprint={2004.07219},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

d4rl_mujoco_halfcheetah/v0-expert (varsayılan yapılandırma)

İndirme boyutu : 83.44 MiB
Veri kümesi boyutu : 98.43 MiB
Otomatik önbelleğe alınmış ( belgeler ): Evet
Bölünmeler :

Bölmek	Örnekler
`'train'`	1.002

Özellik yapısı :

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(17,), dtype=float32),
        'reward': float32,
    }),
})

Özellik belgeleri :

Özellik	Sınıf	Şekil	Dtipi
	ÖzelliklerDict
adımlar	Veri kümesi
adımlar/eylem	Tensör	(6,)	kayan nokta32
adımlar/indirim	Tensör		kayan nokta32
adımlar/is_first	Tensör		bool
adımlar/is_last	Tensör		bool
adımlar/is_terminal	Tensör		bool
adımlar/gözlem	Tensör	(17,)	kayan nokta32
adımlar/ödül	Tensör		kayan nokta32

Örnekler ( tfds.as_dataframe ):

d4rl_mujoco_halfcheetah/v0-medium

İndirme boyutu : 82.92 MiB
Veri kümesi boyutu : 98.43 MiB
Otomatik önbelleğe alınmış ( belgeler ): Evet
Bölünmeler :

Bölmek	Örnekler
`'train'`	1.002

Özellik yapısı :

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(17,), dtype=float32),
        'reward': float32,
    }),
})

Özellik belgeleri :

Özellik	Sınıf	Şekil	Dtipi
	ÖzelliklerDict
adımlar	Veri kümesi
adımlar/eylem	Tensör	(6,)	kayan nokta32
adımlar/indirim	Tensör		kayan nokta32
adımlar/is_first	Tensör		bool
adımlar/is_last	Tensör		bool
adımlar/is_terminal	Tensör		bool
adımlar/gözlem	Tensör	(17,)	kayan nokta32
adımlar/ödül	Tensör		kayan nokta32

Örnekler ( tfds.as_dataframe ):

d4rl_mujoco_halfcheetah/v0-medium-expert

İndirme boyutu : 166.36 MiB
Veri kümesi boyutu : 196.86 MiB
Otomatik önbelleğe alınmış ( belgeler ): Yalnızca shuffle_files=False (train) olduğunda
Bölünmeler :

Bölmek	Örnekler
`'train'`	2.004

Özellik yapısı :

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(17,), dtype=float32),
        'reward': float32,
    }),
})

Özellik belgeleri :

Özellik	Sınıf	Şekil	Dtipi
	ÖzelliklerDict
adımlar	Veri kümesi
adımlar/eylem	Tensör	(6,)	kayan nokta32
adımlar/indirim	Tensör		kayan nokta32
adımlar/is_first	Tensör		bool
adımlar/is_last	Tensör		bool
adımlar/is_terminal	Tensör		bool
adımlar/gözlem	Tensör	(17,)	kayan nokta32
adımlar/ödül	Tensör		kayan nokta32

Örnekler ( tfds.as_dataframe ):

d4rl_mujoco_halfcheetah/v0-mixed

İndirme boyutu : 8.60 MiB
Veri kümesi boyutu : 9.94 MiB
Otomatik önbelleğe alınmış ( belgeler ): Evet
Bölünmeler :

Bölmek	Örnekler
`'train'`	101

Özellik yapısı :

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(17,), dtype=float32),
        'reward': float32,
    }),
})

Özellik belgeleri :

Özellik	Sınıf	Şekil	Dtipi
	ÖzelliklerDict
adımlar	Veri kümesi
adımlar/eylem	Tensör	(6,)	kayan nokta32
adımlar/indirim	Tensör		kayan nokta32
adımlar/is_first	Tensör		bool
adımlar/is_last	Tensör		bool
adımlar/is_terminal	Tensör		bool
adımlar/gözlem	Tensör	(17,)	kayan nokta32
adımlar/ödül	Tensör		kayan nokta32

Örnekler ( tfds.as_dataframe ):

d4rl_mujoco_halfcheetah/v0-random

İndirme boyutu : 84.79 MiB
Veri kümesi boyutu : 98.43 MiB
Otomatik önbelleğe alınmış ( belgeler ): Evet
Bölünmeler :

Bölmek	Örnekler
`'train'`	1.002

Özellik yapısı :

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(17,), dtype=float32),
        'reward': float32,
    }),
})

Özellik belgeleri :

Özellik	Sınıf	Şekil	Dtipi
	ÖzelliklerDict
adımlar	Veri kümesi
adımlar/eylem	Tensör	(6,)	kayan nokta32
adımlar/indirim	Tensör		kayan nokta32
adımlar/is_first	Tensör		bool
adımlar/is_last	Tensör		bool
adımlar/is_terminal	Tensör		bool
adımlar/gözlem	Tensör	(17,)	kayan nokta32
adımlar/ödül	Tensör		kayan nokta32

Örnekler ( tfds.as_dataframe ):

d4rl_mujoco_halfcheetah/v1-expert

İndirme boyutu : 146.94 MiB
Veri kümesi boyutu : 451.88 MiB
Otomatik önbelleğe alınmış ( belgeler ): Hayır
Bölünmeler :

Bölmek	Örnekler
`'train'`	1.000

Özellik yapısı :

FeaturesDict({
    'algorithm': string,
    'iteration': int32,
    'policy': FeaturesDict({
        'fc0': FeaturesDict({
            'bias': Tensor(shape=(256,), dtype=float32),
            'weight': Tensor(shape=(256, 17), dtype=float32),
        }),
        'fc1': FeaturesDict({
            'bias': Tensor(shape=(256,), dtype=float32),
            'weight': Tensor(shape=(256, 256), dtype=float32),
        }),
        'last_fc': FeaturesDict({
            'bias': Tensor(shape=(6,), dtype=float32),
            'weight': Tensor(shape=(6, 256), dtype=float32),
        }),
        'last_fc_log_std': FeaturesDict({
            'bias': Tensor(shape=(6,), dtype=float32),
            'weight': Tensor(shape=(6, 256), dtype=float32),
        }),
        'nonlinearity': string,
        'output_distribution': string,
    }),
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': float32,
        'infos': FeaturesDict({
            'action_log_probs': float32,
            'qpos': Tensor(shape=(9,), dtype=float32),
            'qvel': Tensor(shape=(9,), dtype=float32),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(17,), dtype=float32),
        'reward': float32,
    }),
})

Özellik belgeleri :

Özellik	Sınıf	Şekil	Dtipi
	ÖzelliklerDict
algoritma	Tensör		sicim
yineleme	Tensör		int32
politika	ÖzelliklerDict
politika/fc0	ÖzelliklerDict
politika/fc0/önyargı	Tensör	(256,)	kayan nokta32
politika/fc0/ağırlık	Tensör	(256, 17)	kayan nokta32
politika/fc1	ÖzelliklerDict
politika/fc1/önyargı	Tensör	(256,)	kayan nokta32
politika/fc1/ağırlık	Tensör	(256, 256)	kayan nokta32
politika/last_fc	ÖzelliklerDict
politika/last_fc/bias	Tensör	(6,)	kayan nokta32
politika/last_fc/ağırlık	Tensör	(6, 256)	kayan nokta32
politika/last_fc_log_std	ÖzelliklerDict
politika/last_fc_log_std/bias	Tensör	(6,)	kayan nokta32
politika/last_fc_log_std/weight	Tensör	(6, 256)	kayan nokta32
politika/doğrusal olmama	Tensör		sicim
politika/çıkış_dağıtımı	Tensör		sicim
adımlar	Veri kümesi
adımlar/eylem	Tensör	(6,)	kayan nokta32
adımlar/indirim	Tensör		kayan nokta32
adımlar/bilgiler	ÖzelliklerDict
adımlar/bilgiler/action_log_probs	Tensör		kayan nokta32
adımlar/bilgiler/qpos	Tensör	(9,)	kayan nokta32
adımlar/bilgiler/qvel	Tensör	(9,)	kayan nokta32
adımlar/is_first	Tensör		bool
adımlar/is_last	Tensör		bool
adımlar/is_terminal	Tensör		bool
adımlar/gözlem	Tensör	(17,)	kayan nokta32
adımlar/ödül	Tensör		kayan nokta32

Örnekler ( tfds.as_dataframe ):

d4rl_mujoco_halfcheetah/v1-medium

İndirme boyutu : 146.65 MiB
Veri kümesi boyutu : 451.88 MiB
Otomatik önbelleğe alınmış ( belgeler ): Hayır
Bölünmeler :

Bölmek	Örnekler
`'train'`	1.000

Özellik yapısı :

FeaturesDict({
    'algorithm': string,
    'iteration': int32,
    'policy': FeaturesDict({
        'fc0': FeaturesDict({
            'bias': Tensor(shape=(256,), dtype=float32),
            'weight': Tensor(shape=(256, 17), dtype=float32),
        }),
        'fc1': FeaturesDict({
            'bias': Tensor(shape=(256,), dtype=float32),
            'weight': Tensor(shape=(256, 256), dtype=float32),
        }),
        'last_fc': FeaturesDict({
            'bias': Tensor(shape=(6,), dtype=float32),
            'weight': Tensor(shape=(6, 256), dtype=float32),
        }),
        'last_fc_log_std': FeaturesDict({
            'bias': Tensor(shape=(6,), dtype=float32),
            'weight': Tensor(shape=(6, 256), dtype=float32),
        }),
        'nonlinearity': string,
        'output_distribution': string,
    }),
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': float32,
        'infos': FeaturesDict({
            'action_log_probs': float32,
            'qpos': Tensor(shape=(9,), dtype=float32),
            'qvel': Tensor(shape=(9,), dtype=float32),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(17,), dtype=float32),
        'reward': float32,
    }),
})

Özellik belgeleri :

Özellik	Sınıf	Şekil	Dtipi
	ÖzelliklerDict
algoritma	Tensör		sicim
yineleme	Tensör		int32
politika	ÖzelliklerDict
politika/fc0	ÖzelliklerDict
politika/fc0/önyargı	Tensör	(256,)	kayan nokta32
politika/fc0/ağırlık	Tensör	(256, 17)	kayan nokta32
politika/fc1	ÖzelliklerDict
politika/fc1/önyargı	Tensör	(256,)	kayan nokta32
politika/fc1/ağırlık	Tensör	(256, 256)	kayan nokta32
politika/last_fc	ÖzelliklerDict
politika/last_fc/bias	Tensör	(6,)	kayan nokta32
politika/last_fc/ağırlık	Tensör	(6, 256)	kayan nokta32
politika/last_fc_log_std	ÖzelliklerDict
politika/last_fc_log_std/bias	Tensör	(6,)	kayan nokta32
politika/last_fc_log_std/weight	Tensör	(6, 256)	kayan nokta32
politika/doğrusal olmama	Tensör		sicim
politika/çıkış_dağıtımı	Tensör		sicim
adımlar	Veri kümesi
adımlar/eylem	Tensör	(6,)	kayan nokta32
adımlar/indirim	Tensör		kayan nokta32
adımlar/bilgiler	ÖzelliklerDict
adımlar/bilgiler/action_log_probs	Tensör		kayan nokta32
adımlar/bilgiler/qpos	Tensör	(9,)	kayan nokta32
adımlar/bilgiler/qvel	Tensör	(9,)	kayan nokta32
adımlar/is_first	Tensör		bool
adımlar/is_last	Tensör		bool
adımlar/is_terminal	Tensör		bool
adımlar/gözlem	Tensör	(17,)	kayan nokta32
adımlar/ödül	Tensör		kayan nokta32

Örnekler ( tfds.as_dataframe ):

d4rl_mujoco_halfcheetah/v1-medium-expert

İndirme boyutu : 293.00 MiB
Veri kümesi boyutu : 342.37 MiB
Otomatik önbelleğe alınmış ( belgeler ): Hayır
Bölünmeler :

Bölmek	Örnekler
`'train'`	2.000

Özellik yapısı :

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': float32,
        'infos': FeaturesDict({
            'action_log_probs': float32,
            'qpos': Tensor(shape=(9,), dtype=float32),
            'qvel': Tensor(shape=(9,), dtype=float32),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(17,), dtype=float32),
        'reward': float32,
    }),
})

Özellik belgeleri :

Özellik	Sınıf	Şekil	Dtipi
	ÖzelliklerDict
adımlar	Veri kümesi
adımlar/eylem	Tensör	(6,)	kayan nokta32
adımlar/indirim	Tensör		kayan nokta32
adımlar/bilgiler	ÖzelliklerDict
adımlar/bilgiler/action_log_probs	Tensör		kayan nokta32
adımlar/bilgiler/qpos	Tensör	(9,)	kayan nokta32
adımlar/bilgiler/qvel	Tensör	(9,)	kayan nokta32
adımlar/is_first	Tensör		bool
adımlar/is_last	Tensör		bool
adımlar/is_terminal	Tensör		bool
adımlar/gözlem	Tensör	(17,)	kayan nokta32
adımlar/ödül	Tensör		kayan nokta32

Örnekler ( tfds.as_dataframe ):

d4rl_mujoco_halfcheetah/v1-medium-tekrar oynatma

İndirme boyutu : 57.68 MiB
Veri kümesi boyutu : 34.59 MiB
Otomatik önbelleğe alınmış ( belgeler ): Evet
Bölünmeler :

Bölmek	Örnekler
`'train'`	202

Özellik yapısı :

FeaturesDict({
    'algorithm': string,
    'iteration': int32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float64),
        'discount': float64,
        'infos': FeaturesDict({
            'action_log_probs': float64,
            'qpos': Tensor(shape=(9,), dtype=float64),
            'qvel': Tensor(shape=(9,), dtype=float64),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(17,), dtype=float64),
        'reward': float64,
    }),
})

Özellik belgeleri :

Özellik	Sınıf	Şekil	Dtipi
	ÖzelliklerDict
algoritma	Tensör		sicim
yineleme	Tensör		int32
adımlar	Veri kümesi
adımlar/eylem	Tensör	(6,)	kayan nokta64
adımlar/indirim	Tensör		kayan nokta64
adımlar/bilgiler	ÖzelliklerDict
adımlar/bilgiler/action_log_probs	Tensör		kayan nokta64
adımlar/bilgiler/qpos	Tensör	(9,)	kayan nokta64
adımlar/bilgiler/qvel	Tensör	(9,)	kayan nokta64
adımlar/is_first	Tensör		bool
adımlar/is_last	Tensör		bool
adımlar/is_terminal	Tensör		bool
adımlar/gözlem	Tensör	(17,)	kayan nokta64
adımlar/ödül	Tensör		kayan nokta64

Örnekler ( tfds.as_dataframe ):

d4rl_mujoco_halfcheetah/v1-tam tekrar oynatma

İndirme boyutu : 285.01 MiB
Veri kümesi boyutu : 171.22 MiB
Otomatik önbelleğe alınmış ( belgeler ): Yalnızca shuffle_files=False (train) olduğunda
Bölünmeler :

Bölmek	Örnekler
`'train'`	1.000

Özellik yapısı :

FeaturesDict({
    'algorithm': string,
    'iteration': int32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float64),
        'discount': float64,
        'infos': FeaturesDict({
            'action_log_probs': float64,
            'qpos': Tensor(shape=(9,), dtype=float64),
            'qvel': Tensor(shape=(9,), dtype=float64),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(17,), dtype=float64),
        'reward': float64,
    }),
})

Özellik belgeleri :

Özellik	Sınıf	Şekil	Dtipi
	ÖzelliklerDict
algoritma	Tensör		sicim
yineleme	Tensör		int32
adımlar	Veri kümesi
adımlar/eylem	Tensör	(6,)	kayan nokta64
adımlar/indirim	Tensör		kayan nokta64
adımlar/bilgiler	ÖzelliklerDict
adımlar/bilgiler/action_log_probs	Tensör		kayan nokta64
adımlar/bilgiler/qpos	Tensör	(9,)	kayan nokta64
adımlar/bilgiler/qvel	Tensör	(9,)	kayan nokta64
adımlar/is_first	Tensör		bool
adımlar/is_last	Tensör		bool
adımlar/is_terminal	Tensör		bool
adımlar/gözlem	Tensör	(17,)	kayan nokta64
adımlar/ödül	Tensör		kayan nokta64

Örnekler ( tfds.as_dataframe ):

d4rl_mujoco_halfcheetah/v1-random

İndirme boyutu : 145.19 MiB
Veri kümesi boyutu : 171.18 MiB
Otomatik önbelleğe alınmış ( belgeler ): Yalnızca shuffle_files=False (train) olduğunda
Bölünmeler :

Bölmek	Örnekler
`'train'`	1.000

Özellik yapısı :

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': float32,
        'infos': FeaturesDict({
            'action_log_probs': float32,
            'qpos': Tensor(shape=(9,), dtype=float32),
            'qvel': Tensor(shape=(9,), dtype=float32),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(17,), dtype=float32),
        'reward': float32,
    }),
})

Özellik belgeleri :

Özellik	Sınıf	Şekil	Dtipi
	ÖzelliklerDict
adımlar	Veri kümesi
adımlar/eylem	Tensör	(6,)	kayan nokta32
adımlar/indirim	Tensör		kayan nokta32
adımlar/bilgiler	ÖzelliklerDict
adımlar/bilgiler/action_log_probs	Tensör		kayan nokta32
adımlar/bilgiler/qpos	Tensör	(9,)	kayan nokta32
adımlar/bilgiler/qvel	Tensör	(9,)	kayan nokta32
adımlar/is_first	Tensör		bool
adımlar/is_last	Tensör		bool
adımlar/is_terminal	Tensör		bool
adımlar/gözlem	Tensör	(17,)	kayan nokta32
adımlar/ödül	Tensör		kayan nokta32

Örnekler ( tfds.as_dataframe ):

d4rl_mujoco_halfcheetah/v2-expert

İndirme boyutu : 226.46 MiB
Veri kümesi boyutu : 451.88 MiB
Otomatik önbelleğe alınmış ( belgeler ): Hayır
Bölünmeler :

Bölmek	Örnekler
`'train'`	1.000

Özellik yapısı :

FeaturesDict({
    'algorithm': string,
    'iteration': int32,
    'policy': FeaturesDict({
        'fc0': FeaturesDict({
            'bias': Tensor(shape=(256,), dtype=float32),
            'weight': Tensor(shape=(256, 17), dtype=float32),
        }),
        'fc1': FeaturesDict({
            'bias': Tensor(shape=(256,), dtype=float32),
            'weight': Tensor(shape=(256, 256), dtype=float32),
        }),
        'last_fc': FeaturesDict({
            'bias': Tensor(shape=(6,), dtype=float32),
            'weight': Tensor(shape=(6, 256), dtype=float32),
        }),
        'last_fc_log_std': FeaturesDict({
            'bias': Tensor(shape=(6,), dtype=float32),
            'weight': Tensor(shape=(6, 256), dtype=float32),
        }),
        'nonlinearity': string,
        'output_distribution': string,
    }),
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': float32,
        'infos': FeaturesDict({
            'action_log_probs': float64,
            'qpos': Tensor(shape=(9,), dtype=float64),
            'qvel': Tensor(shape=(9,), dtype=float64),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(17,), dtype=float32),
        'reward': float32,
    }),
})

Özellik belgeleri :

Özellik	Sınıf	Şekil	Dtipi
	ÖzelliklerDict
algoritma	Tensör		sicim
yineleme	Tensör		int32
politika	ÖzelliklerDict
politika/fc0	ÖzelliklerDict
politika/fc0/önyargı	Tensör	(256,)	kayan nokta32
politika/fc0/ağırlık	Tensör	(256, 17)	kayan nokta32
politika/fc1	ÖzelliklerDict
politika/fc1/önyargı	Tensör	(256,)	kayan nokta32
politika/fc1/ağırlık	Tensör	(256, 256)	kayan nokta32
politika/last_fc	ÖzelliklerDict
politika/last_fc/bias	Tensör	(6,)	kayan nokta32
politika/last_fc/ağırlık	Tensör	(6, 256)	kayan nokta32
politika/last_fc_log_std	ÖzelliklerDict
politika/last_fc_log_std/bias	Tensör	(6,)	kayan nokta32
politika/last_fc_log_std/weight	Tensör	(6, 256)	kayan nokta32
politika/doğrusal olmama	Tensör		sicim
politika/çıkış_dağıtımı	Tensör		sicim
adımlar	Veri kümesi
adımlar/eylem	Tensör	(6,)	kayan nokta32
adımlar/indirim	Tensör		kayan nokta32
adımlar/bilgiler	ÖzelliklerDict
adımlar/bilgiler/action_log_probs	Tensör		kayan nokta64
adımlar/bilgiler/qpos	Tensör	(9,)	kayan nokta64
adımlar/bilgiler/qvel	Tensör	(9,)	kayan nokta64
adımlar/is_first	Tensör		bool
adımlar/is_last	Tensör		bool
adımlar/is_terminal	Tensör		bool
adımlar/gözlem	Tensör	(17,)	kayan nokta32
adımlar/ödül	Tensör		kayan nokta32

Örnekler ( tfds.as_dataframe ):

d4rl_mujoco_halfcheetah/v2-tam tekrar oynatma

İndirme boyutu : 277.88 MiB
Veri kümesi boyutu : 171.22 MiB
Otomatik önbelleğe alınmış ( belgeler ): Yalnızca shuffle_files=False (train) olduğunda
Bölünmeler :

Bölmek	Örnekler
`'train'`	1.000

Özellik yapısı :

FeaturesDict({
    'algorithm': string,
    'iteration': int32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': float32,
        'infos': FeaturesDict({
            'action_log_probs': float64,
            'qpos': Tensor(shape=(9,), dtype=float64),
            'qvel': Tensor(shape=(9,), dtype=float64),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(17,), dtype=float32),
        'reward': float32,
    }),
})

Özellik belgeleri :

Özellik	Sınıf	Şekil	Dtipi
	ÖzelliklerDict
algoritma	Tensör		sicim
yineleme	Tensör		int32
adımlar	Veri kümesi
adımlar/eylem	Tensör	(6,)	kayan nokta32
adımlar/indirim	Tensör		kayan nokta32
adımlar/bilgiler	ÖzelliklerDict
adımlar/bilgiler/action_log_probs	Tensör		kayan nokta64
adımlar/bilgiler/qpos	Tensör	(9,)	kayan nokta64
adımlar/bilgiler/qvel	Tensör	(9,)	kayan nokta64
adımlar/is_first	Tensör		bool
adımlar/is_last	Tensör		bool
adımlar/is_terminal	Tensör		bool
adımlar/gözlem	Tensör	(17,)	kayan nokta32
adımlar/ödül	Tensör		kayan nokta32

Örnekler ( tfds.as_dataframe ):

d4rl_mujoco_halfcheetah/v2-medium

İndirme boyutu : 226.71 MiB
Veri kümesi boyutu : 451.88 MiB
Otomatik önbelleğe alınmış ( belgeler ): Hayır
Bölünmeler :

Bölmek	Örnekler
`'train'`	1.000

Özellik yapısı :

FeaturesDict({
    'algorithm': string,
    'iteration': int32,
    'policy': FeaturesDict({
        'fc0': FeaturesDict({
            'bias': Tensor(shape=(256,), dtype=float32),
            'weight': Tensor(shape=(256, 17), dtype=float32),
        }),
        'fc1': FeaturesDict({
            'bias': Tensor(shape=(256,), dtype=float32),
            'weight': Tensor(shape=(256, 256), dtype=float32),
        }),
        'last_fc': FeaturesDict({
            'bias': Tensor(shape=(6,), dtype=float32),
            'weight': Tensor(shape=(6, 256), dtype=float32),
        }),
        'last_fc_log_std': FeaturesDict({
            'bias': Tensor(shape=(6,), dtype=float32),
            'weight': Tensor(shape=(6, 256), dtype=float32),
        }),
        'nonlinearity': string,
        'output_distribution': string,
    }),
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': float32,
        'infos': FeaturesDict({
            'action_log_probs': float64,
            'qpos': Tensor(shape=(9,), dtype=float64),
            'qvel': Tensor(shape=(9,), dtype=float64),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(17,), dtype=float32),
        'reward': float32,
    }),
})

Özellik belgeleri :

Özellik	Sınıf	Şekil	Dtipi
	ÖzelliklerDict
algoritma	Tensör		sicim
yineleme	Tensör		int32
politika	ÖzelliklerDict
politika/fc0	ÖzelliklerDict
politika/fc0/önyargı	Tensör	(256,)	kayan nokta32
politika/fc0/ağırlık	Tensör	(256, 17)	kayan nokta32
politika/fc1	ÖzelliklerDict
politika/fc1/önyargı	Tensör	(256,)	kayan nokta32
politika/fc1/ağırlık	Tensör	(256, 256)	kayan nokta32
politika/last_fc	ÖzelliklerDict
politika/last_fc/bias	Tensör	(6,)	kayan nokta32
politika/last_fc/ağırlık	Tensör	(6, 256)	kayan nokta32
politika/last_fc_log_std	ÖzelliklerDict
politika/last_fc_log_std/bias	Tensör	(6,)	kayan nokta32
politika/last_fc_log_std/weight	Tensör	(6, 256)	kayan nokta32
politika/doğrusal olmama	Tensör		sicim
politika/çıkış_dağıtımı	Tensör		sicim
adımlar	Veri kümesi
adımlar/eylem	Tensör	(6,)	kayan nokta32
adımlar/indirim	Tensör		kayan nokta32
adımlar/bilgiler	ÖzelliklerDict
adımlar/bilgiler/action_log_probs	Tensör		kayan nokta64
adımlar/bilgiler/qpos	Tensör	(9,)	kayan nokta64
adımlar/bilgiler/qvel	Tensör	(9,)	kayan nokta64
adımlar/is_first	Tensör		bool
adımlar/is_last	Tensör		bool
adımlar/is_terminal	Tensör		bool
adımlar/gözlem	Tensör	(17,)	kayan nokta32
adımlar/ödül	Tensör		kayan nokta32

Örnekler ( tfds.as_dataframe ):

d4rl_mujoco_halfcheetah/v2-medium-expert

İndirme boyutu : 452.58 MiB
Veri kümesi boyutu : 342.37 MiB
Otomatik önbelleğe alınmış ( belgeler ): Hayır
Bölünmeler :

Bölmek	Örnekler
`'train'`	2.000

Özellik yapısı :

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': float32,
        'infos': FeaturesDict({
            'action_log_probs': float64,
            'qpos': Tensor(shape=(9,), dtype=float64),
            'qvel': Tensor(shape=(9,), dtype=float64),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(17,), dtype=float32),
        'reward': float32,
    }),
})

Özellik belgeleri :

Özellik	Sınıf	Şekil	Dtipi
	ÖzelliklerDict
adımlar	Veri kümesi
adımlar/eylem	Tensör	(6,)	kayan nokta32
adımlar/indirim	Tensör		kayan nokta32
adımlar/bilgiler	ÖzelliklerDict
adımlar/bilgiler/action_log_probs	Tensör		kayan nokta64
adımlar/bilgiler/qpos	Tensör	(9,)	kayan nokta64
adımlar/bilgiler/qvel	Tensör	(9,)	kayan nokta64
adımlar/is_first	Tensör		bool
adımlar/is_last	Tensör		bool
adımlar/is_terminal	Tensör		bool
adımlar/gözlem	Tensör	(17,)	kayan nokta32
adımlar/ödül	Tensör		kayan nokta32

Örnekler ( tfds.as_dataframe ):

d4rl_mujoco_halfcheetah/v2-medium-tekrar oynatma

İndirme boyutu : 56.69 MiB
Veri kümesi boyutu : 34.59 MiB
Otomatik önbelleğe alınmış ( belgeler ): Evet
Bölünmeler :

Bölmek	Örnekler
`'train'`	202

Özellik yapısı :

FeaturesDict({
    'algorithm': string,
    'iteration': int32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': float32,
        'infos': FeaturesDict({
            'action_log_probs': float64,
            'qpos': Tensor(shape=(9,), dtype=float64),
            'qvel': Tensor(shape=(9,), dtype=float64),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(17,), dtype=float32),
        'reward': float32,
    }),
})

Özellik belgeleri :

Özellik	Sınıf	Şekil	Dtipi
	ÖzelliklerDict
algoritma	Tensör		sicim
yineleme	Tensör		int32
adımlar	Veri kümesi
adımlar/eylem	Tensör	(6,)	kayan nokta32
adımlar/indirim	Tensör		kayan nokta32
adımlar/bilgiler	ÖzelliklerDict
adımlar/bilgiler/action_log_probs	Tensör		kayan nokta64
adımlar/bilgiler/qpos	Tensör	(9,)	kayan nokta64
adımlar/bilgiler/qvel	Tensör	(9,)	kayan nokta64
adımlar/is_first	Tensör		bool
adımlar/is_last	Tensör		bool
adımlar/is_terminal	Tensör		bool
adımlar/gözlem	Tensör	(17,)	kayan nokta32
adımlar/ödül	Tensör		kayan nokta32

Örnekler ( tfds.as_dataframe ):

d4rl_mujoco_halfcheetah/v2-random

İndirme boyutu : 226.34 MiB
Veri kümesi boyutu : 171.18 MiB
Otomatik önbelleğe alınmış ( belgeler ): Yalnızca shuffle_files=False (train) olduğunda
Bölünmeler :

Bölmek	Örnekler
`'train'`	1.000

Özellik yapısı :

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': float32,
        'infos': FeaturesDict({
            'action_log_probs': float64,
            'qpos': Tensor(shape=(9,), dtype=float64),
            'qvel': Tensor(shape=(9,), dtype=float64),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(17,), dtype=float32),
        'reward': float32,
    }),
})

Özellik belgeleri :

Özellik	Sınıf	Şekil	Dtipi
	ÖzelliklerDict
adımlar	Veri kümesi
adımlar/eylem	Tensör	(6,)	kayan nokta32
adımlar/indirim	Tensör		kayan nokta32
adımlar/bilgiler	ÖzelliklerDict
adımlar/bilgiler/action_log_probs	Tensör		kayan nokta64
adımlar/bilgiler/qpos	Tensör	(9,)	kayan nokta64
adımlar/bilgiler/qvel	Tensör	(9,)	kayan nokta64
adımlar/is_first	Tensör		bool
adımlar/is_last	Tensör		bool
adımlar/is_terminal	Tensör		bool
adımlar/gözlem	Tensör	(17,)	kayan nokta32
adımlar/ödül	Tensör		kayan nokta32

Örnekler ( tfds.as_dataframe ):

d4rl_mujoco_halfcheetah Koleksiyonlar ile düzeninizi koruyun İçeriği tercihlerinize göre kaydedin ve kategorilere ayırın.