TFDS תומך כעת בפורמט קרואסון 🥐 ! קרא את התיעוד כדי לדעת יותר.

דף זה תורגם על ידי Cloud Translation API.

תְנוּעָה

תיאור :

מערכי הנתונים נוצרו עם סוכן SAC שהוכשר על תגמול הסביבה של משימות תנועה של MuJoCo. מערכי נתונים אלה משמשים ב- What Matters for Adversarial Imitation Learning? אורסיני וחב'. 2021 .

מערכי הנתונים פועלים לפי פורמט RLDS כדי לייצג שלבים ופרקים

דף הבית : https://github.com/google-research/rlds
קוד מקור : tfds.rlds.datasets.locomotion.Locomotion
גרסאות :
- 1.0.0 (ברירת מחדל): שחרור ראשוני.
מפתחות בפיקוח (ראה as_supervised doc ): None
איור ( tfds.show_examples ): לא נתמך.
ציטוט :

@article{orsini2021matters,
  title={What Matters for Adversarial Imitation Learning?},
  author={Orsini, Manu and Raichuk, Anton and Hussenot, L{'e}onard and Vincent, Damien and Dadashi, Robert and Girgin, Sertan and Geist, Matthieu and Bachem, Olivier and Pietquin, Olivier and Andrychowicz, Marcin},
  journal={International Conference in Machine Learning},
  year={2021}
}

locomotion/ant_sac_1M_single_policy_stochastic (תצורת ברירת המחדל)

תיאור תצורה : מערך נתונים שנוצר על ידי סוכן SAC שהוכשר ל-1 מיליון שלבים עבור Ant.
גודל הורדה : 6.49 MiB
גודל ערכת נתונים : 23.02 MiB
שמור אוטומטי במטמון ( תיעוד ): כן
פיצולים :

לְפַצֵל	דוגמאות
`'train'`	50

מבנה תכונה :

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(111,), dtype=float32),
        'reward': float32,
    }),
})

תיעוד תכונה :

תכונה	מעמד	צוּרָה	Dtype
	FeaturesDict
צעדים	מערך נתונים
צעדים/פעולה	מוֹתֵחַ	(8,)	לצוף32
צעדים/הנחה	מוֹתֵחַ		לצוף32
צעדים/הוא_ראשון	מוֹתֵחַ		bool
צעדים/הוא_אחרון	מוֹתֵחַ		bool
steps/is_terminal	מוֹתֵחַ		bool
צעדים/תצפית	מוֹתֵחַ	(111,)	לצוף32
צעדים/פרס	מוֹתֵחַ		לצוף32

דוגמאות ( tfds.as_dataframe ):

locomotion/hopper_sac_1M_single_policy_stochastic

תיאור תצורה : מערך נתונים שנוצר על ידי סוכן SAC שהוכשר ל-1 מיליון שלבים עבור Hopper.
גודל הורדה : 2.26 MiB
גודל ערכת נתונים : 2.62 MiB
שמור אוטומטי במטמון ( תיעוד ): כן
פיצולים :

לְפַצֵל	דוגמאות
`'train'`	50

מבנה תכונה :

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(3,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(11,), dtype=float32),
        'reward': float32,
    }),
})

תיעוד תכונה :

תכונה	מעמד	צוּרָה	Dtype
	FeaturesDict
צעדים	מערך נתונים
צעדים/פעולה	מוֹתֵחַ	(3,)	לצוף32
צעדים/הנחה	מוֹתֵחַ		לצוף32
צעדים/הוא_ראשון	מוֹתֵחַ		bool
צעדים/הוא_אחרון	מוֹתֵחַ		bool
steps/is_terminal	מוֹתֵחַ		bool
צעדים/תצפית	מוֹתֵחַ	(11,)	לצוף32
צעדים/פרס	מוֹתֵחַ		לצוף32

דוגמאות ( tfds.as_dataframe ):

locomotion/halfcheetah_sac_1M_single_policy_stochastic

תיאור תצורה : מערך נתונים שנוצר על ידי סוכן SAC שהוכשר ל-1 מיליון שלבים עבור HalfChetah.
גודל הורדה : 4.49 MiB
גודל ערכת נתונים : 4.93 MiB
שמור אוטומטי במטמון ( תיעוד ): כן
פיצולים :

לְפַצֵל	דוגמאות
`'train'`	50

מבנה תכונה :

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(17,), dtype=float32),
        'reward': float32,
    }),
})

תיעוד תכונה :

תכונה	מעמד	צוּרָה	Dtype
	FeaturesDict
צעדים	מערך נתונים
צעדים/פעולה	מוֹתֵחַ	(6,)	לצוף32
צעדים/הנחה	מוֹתֵחַ		לצוף32
צעדים/הוא_ראשון	מוֹתֵחַ		bool
צעדים/הוא_אחרון	מוֹתֵחַ		bool
steps/is_terminal	מוֹתֵחַ		bool
צעדים/תצפית	מוֹתֵחַ	(17,)	לצוף32
צעדים/פרס	מוֹתֵחַ		לצוף32

דוגמאות ( tfds.as_dataframe ):

locomotion/walker2d_sac_1M_single_policy_stochastic

תיאור תצורה : מערך נתונים שנוצר על ידי סוכן SAC שהוכשר ל-1 מיליון שלבים עבור Walker2d.
גודל הורדה : 4.35 MiB
גודל ערכת נתונים : 4.91 MiB
שמור אוטומטי במטמון ( תיעוד ): כן
פיצולים :

לְפַצֵל	דוגמאות
`'train'`	50

מבנה תכונה :

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(17,), dtype=float32),
        'reward': float32,
    }),
})

תיעוד תכונה :

תכונה	מעמד	צוּרָה	Dtype
	FeaturesDict
צעדים	מערך נתונים
צעדים/פעולה	מוֹתֵחַ	(6,)	לצוף32
צעדים/הנחה	מוֹתֵחַ		לצוף32
צעדים/הוא_ראשון	מוֹתֵחַ		bool
צעדים/הוא_אחרון	מוֹתֵחַ		bool
steps/is_terminal	מוֹתֵחַ		bool
צעדים/תצפית	מוֹתֵחַ	(17,)	לצוף32
צעדים/פרס	מוֹתֵחַ		לצוף32

דוגמאות ( tfds.as_dataframe ):

locomotion/humanoid_sac_15M_single_policy_stochastic

תיאור תצורה : מערך נתונים שנוצר על ידי סוכן SAC שהוכשר ל-15 מיליון שלבים עבור Humanoid.
גודל הורדה : 192.78 MiB
גודל מערך נתונים : 300.94 MiB
שמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :

לְפַצֵל	דוגמאות
`'train'`	200

מבנה תכונה :

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(17,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(376,), dtype=float32),
        'reward': float32,
    }),
})

תיעוד תכונה :

תכונה	מעמד	צוּרָה	Dtype
	FeaturesDict
צעדים	מערך נתונים
צעדים/פעולה	מוֹתֵחַ	(17,)	לצוף32
צעדים/הנחה	מוֹתֵחַ		לצוף32
צעדים/הוא_ראשון	מוֹתֵחַ		bool
צעדים/הוא_אחרון	מוֹתֵחַ		bool
steps/is_terminal	מוֹתֵחַ		bool
צעדים/תצפית	מוֹתֵחַ	(376,)	לצוף32
צעדים/פרס	מוֹתֵחַ		לצוף32

דוגמאות ( tfds.as_dataframe ):

תְנוּעָה קל לארגן דפים בעזרת אוספים אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.