TFDS תומך כעת בפורמט קרואסון 🥐 ! קרא את התיעוד כדי לדעת יותר.

דף זה תורגם על ידי Cloud Translation API.

d4rl_antmaze

תיאור :

D4RL הוא אמת מידה בקוד פתוח ללמידת חיזוק לא מקוון. הוא מספק סביבות סטנדרטיות ומערכי נתונים עבור אלגוריתמי הדרכה ומידוד.

מערכי הנתונים פועלים לפי פורמט RLDS כדי לייצג שלבים ופרקים.

תיאור תצורה : ראה פרטים נוספים על המשימה וגרסאותיה ב- https://github.com/rail-berkeley/d4rl/wiki/Tasks#antmaze
דף הבית : https://sites.google.com/view/d4rl-anonymous
קוד מקור : tfds.d4rl.d4rl_antmaze.D4rlAntmaze
גרסאות :
- 1.0.0 : שחרור ראשוני.
- 1.1.1 (ברירת מחדל): נוספו מערכי נתונים v2.
שמור אוטומטי במטמון ( תיעוד ): לא
מבנה תכונה :

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float32),
        'discount': float32,
        'infos': FeaturesDict({
            'goal': Tensor(shape=(2,), dtype=float32),
            'qpos': Tensor(shape=(15,), dtype=float32),
            'qvel': Tensor(shape=(14,), dtype=float32),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(29,), dtype=float32),
        'reward': float32,
    }),
})

תיעוד תכונה :

תכונה	מעמד	צוּרָה	Dtype
	FeaturesDict
צעדים	מערך נתונים
צעדים/פעולה	מוֹתֵחַ	(8,)	לצוף32
צעדים/הנחה	מוֹתֵחַ		לצוף32
שלבים/מידע	FeaturesDict
צעדים/מידע/מטרה	מוֹתֵחַ	(2,)	לצוף32
צעדים/מידע/qpos	מוֹתֵחַ	(15,)	לצוף32
צעדים/מידע/qvel	מוֹתֵחַ	(14,)	לצוף32
צעדים/הוא_ראשון	מוֹתֵחַ		bool
צעדים/הוא_אחרון	מוֹתֵחַ		bool
steps/is_terminal	מוֹתֵחַ		bool
צעדים/תצפית	מוֹתֵחַ	(29,)	לצוף32
צעדים/פרס	מוֹתֵחַ		לצוף32

מפתחות בפיקוח (ראה as_supervised doc ): None
איור ( tfds.show_examples ): לא נתמך.
ציטוט :

@misc{fu2020d4rl,
    title={D4RL: Datasets for Deep Data-Driven Reinforcement Learning},
    author={Justin Fu and Aviral Kumar and Ofir Nachum and George Tucker and Sergey Levine},
    year={2020},
    eprint={2004.07219},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

d4rl_antmaze/umaze-v0 (תצורת ברירת המחדל)

גודל הורדה : 221.76 MiB
גודל מערך נתונים : 274.83 MiB
פיצולים :

לְפַצֵל	דוגמאות
`'train'`	10,154

דוגמאות ( tfds.as_dataframe ):

d4rl_antmaze/umaze-diverse-v0

גודל הורדה : 220.16 MiB
גודל ערכת נתונים : 270.23 MiB
פיצולים :

לְפַצֵל	דוגמאות
`'train'`	1,154

דוגמאות ( tfds.as_dataframe ):

d4rl_antmaze/medium-play-v0

גודל הורדה : 220.40 MiB
גודל ערכת נתונים : 275.20 MiB
פיצולים :

לְפַצֵל	דוגמאות
`'train'`	10,695

דוגמאות ( tfds.as_dataframe ):

d4rl_antmaze/medium-diverse-v0

גודל הורדה : 220.39 MiB
גודל ערכת נתונים : 271.18 MiB
פיצולים :

לְפַצֵל	דוגמאות
`'train'`	2,924

דוגמאות ( tfds.as_dataframe ):

d4rl_antmaze/large-diverse-v0

גודל הורדה : 220.47 MiB
גודל מערך נתונים : 273.36 MiB
פיצולים :

לְפַצֵל	דוגמאות
`'train'`	7,141

דוגמאות ( tfds.as_dataframe ):

d4rl_antmaze/large-play-v0

גודל הורדה : 220.19 MiB
גודל ערכת נתונים : 276.61 MiB
פיצולים :

לְפַצֵל	דוגמאות
`'train'`	13,458

דוגמאות ( tfds.as_dataframe ):

d4rl_antmaze/umaze-v2

גודל הורדה : 221.76 MiB
גודל מערך נתונים : 274.83 MiB
פיצולים :

לְפַצֵל	דוגמאות
`'train'`	10,154

דוגמאות ( tfds.as_dataframe ):

d4rl_antmaze/umaze-diverse-v2

גודל הורדה : 220.16 MiB
גודל ערכת נתונים : 270.20 MiB
פיצולים :

לְפַצֵל	דוגמאות
`'train'`	1,036

דוגמאות ( tfds.as_dataframe ):

d4rl_antmaze/medium-play-v2

גודל הורדה : 220.40 MiB
גודל מערך נתונים : 275.22 MiB
פיצולים :

לְפַצֵל	דוגמאות
`'train'`	10,768

דוגמאות ( tfds.as_dataframe ):

d4rl_antmaze/medium-diverse-v2

גודל הורדה : 220.39 MiB
גודל מערך נתונים : 271.19 MiB
פיצולים :

לְפַצֵל	דוגמאות
`'train'`	2,959

דוגמאות ( tfds.as_dataframe ):

d4rl_antmaze/large-diverse-v2

גודל הורדה : 220.47 MiB
גודל מערך נתונים : 273.38 MiB
פיצולים :

לְפַצֵל	דוגמאות
`'train'`	7,189

דוגמאות ( tfds.as_dataframe ):

d4rl_antmaze/large-play-v2

גודל הורדה : 220.18 MiB
גודל ערכת נתונים : 276.63 MiB
פיצולים :

לְפַצֵל	דוגמאות
`'train'`	13,517

דוגמאות ( tfds.as_dataframe ):