rlu_rwrl

  • תיאור :

RL Unplugged היא חבילת אמות מידה ללימוד חיזוק לא מקוון. ה-RL Unplugged מתוכנן סביב השיקולים הבאים: כדי להקל על השימוש, אנו מספקים למערכי נתונים עם API מאוחד אשר מקל על המתרגל לעבוד עם כל הנתונים בחבילה לאחר הקמת צינור כללי.

מערכי הנתונים פועלים לפי פורמט RLDS כדי לייצג שלבים ופרקים.

דוגמאות במערך הנתונים מייצגות מעברי SAR המאוחסנים בעת הפעלת סוכן מאומן מקוון חלקית כמתואר ב- https://arxiv.org/abs/1904.12901 . אנו פועלים לפי פורמט מערך הנתונים של RLDS, כמפורט ב- https://github.com/google-research /rlds#dataset-format

אנו משחררים 40 מערכי נתונים על 8 משימות בסך הכל -- ללא אתגר משולב ואתגר משולב קל על עמוד העגלה, הליכון, מרובע ומשימות דמוי אדם. כל משימה מכילה 5 גדלים שונים של מערכי נתונים, 1%, 5%, 20%, 40% ו-100%. שים לב שלא מובטח שמערך הנתונים הקטן יותר הוא תת-קבוצה של הגדולים יותר. לפרטים על אופן יצירת מערך הנתונים, עיין במאמר.

@misc{gulcehre2020rl,
    title={RL Unplugged: Benchmarks for Offline Reinforcement Learning},
    author={Caglar Gulcehre and Ziyu Wang and Alexander Novikov and Tom Le Paine
        and  Sergio Gómez Colmenarejo and Konrad Zolna and Rishabh Agarwal and
        Josh Merel and Daniel Mankowitz and Cosmin Paduraru and Gabriel
        Dulac-Arnold and Jerry Li and Mohammad Norouzi and Matt Hoffman and
        Ofir Nachum and George Tucker and Nicolas Heess and Nando deFreitas},
    year={2020},
    eprint={2006.13888},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

rlu_rwrl/cartpole_swingup_combined_challenge_none_1_percent (תצורת ברירת המחדל)

  • גודל מערך נתונים : 172.43 KiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 5
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (1,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/עמדה מוֹתֵחַ (3,) לצוף32
צעדים/תצפית/מהירות מוֹתֵחַ (2,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/cartpole_swingup_combined_challenge_none_5_percent

  • גודל ערכת נתונים: 862.13 KiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 25
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (1,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/עמדה מוֹתֵחַ (3,) לצוף32
צעדים/תצפית/מהירות מוֹתֵחַ (2,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/cartpole_swingup_combined_challenge_none_20_percent

  • גודל ערכת נתונים : 3.37 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 100
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (1,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/עמדה מוֹתֵחַ (3,) לצוף32
צעדים/תצפית/מהירות מוֹתֵחַ (2,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/cartpole_swingup_combined_challenge_none_40_percent

  • גודל ערכת נתונים : 6.74 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 200
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (1,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/עמדה מוֹתֵחַ (3,) לצוף32
צעדים/תצפית/מהירות מוֹתֵחַ (2,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/cartpole_swingup_combined_challenge_none_100_percent

  • גודל ערכת נתונים : 16.84 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 500
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (1,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/עמדה מוֹתֵחַ (3,) לצוף32
צעדים/תצפית/מהירות מוֹתֵחַ (2,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/quadruped_walk_combined_challenge_none_1_percent

  • גודל מערך נתונים : 1.77 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 5
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (12,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/מצב_אגוצנטריים מוֹתֵחַ (44,) לצוף32
צעדים/תצפית/כוח_מומנט מוֹתֵחַ (24,) לצוף32
צעדים/תצפית/אימו מוֹתֵחַ (6,) לצוף32
צעדים/התבוננות/טורסו_זקוף מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/מהירות_גו מוֹתֵחַ (3,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/quadruped_walk_combined_challenge_none_5_percent

  • גודל ערכת נתונים : 8.86 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 25
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (12,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/מצב_אגוצנטריים מוֹתֵחַ (44,) לצוף32
צעדים/תצפית/כוח_מומנט מוֹתֵחַ (24,) לצוף32
צעדים/תצפית/אימו מוֹתֵחַ (6,) לצוף32
צעדים/התבוננות/טורסו_זקוף מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/מהירות_גו מוֹתֵחַ (3,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/quadruped_walk_combined_challenge_none_20_percent

  • גודל מערך נתונים : 35.46 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 100
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (12,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/מצב_אגוצנטריים מוֹתֵחַ (44,) לצוף32
צעדים/תצפית/כוח_מומנט מוֹתֵחַ (24,) לצוף32
צעדים/תצפית/אימו מוֹתֵחַ (6,) לצוף32
צעדים/התבוננות/טורסו_זקוף מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/מהירות_גו מוֹתֵחַ (3,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/quadruped_walk_combined_challenge_none_40_percent

  • גודל ערכת נתונים: 70.92 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 200
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (12,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/מצב_אגוצנטריים מוֹתֵחַ (44,) לצוף32
צעדים/תצפית/כוח_מומנט מוֹתֵחַ (24,) לצוף32
צעדים/תצפית/אימו מוֹתֵחַ (6,) לצוף32
צעדים/התבוננות/טורסו_זקוף מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/מהירות_גו מוֹתֵחַ (3,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/quadruped_walk_combined_challenge_none_100_percent

  • גודל ערכת נתונים: 177.29 MiB

  • שמור אוטומטי במטמון ( תיעוד ): רק כאשר shuffle_files=False (רכבת)

  • פיצולים :

לְפַצֵל דוגמאות
'train' 500
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (12,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/מצב_אגוצנטריים מוֹתֵחַ (44,) לצוף32
צעדים/תצפית/כוח_מומנט מוֹתֵחַ (24,) לצוף32
צעדים/תצפית/אימו מוֹתֵחַ (6,) לצוף32
צעדים/התבוננות/טורסו_זקוף מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/מהירות_גו מוֹתֵחַ (3,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/walker_walk_combined_challenge_none_1_percent

  • גודל מערך נתונים : 6.27 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 50
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (6,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
מדרגות/תצפית/גובה מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/אוריינטציות מוֹתֵחַ (14,) לצוף32
צעדים/תצפית/מהירות מוֹתֵחַ (9,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/walker_walk_combined_challenge_none_5_percent

  • גודל ערכת נתונים : 31.34 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 250
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (6,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
מדרגות/תצפית/גובה מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/אוריינטציות מוֹתֵחַ (14,) לצוף32
צעדים/תצפית/מהירות מוֹתֵחַ (9,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/walker_walk_combined_challenge_none_20_percent

  • גודל מערך נתונים : 125.37 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 1,000
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (6,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
מדרגות/תצפית/גובה מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/אוריינטציות מוֹתֵחַ (14,) לצוף32
צעדים/תצפית/מהירות מוֹתֵחַ (9,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/walker_walk_combined_challenge_none_40_percent

  • גודל מערך נתונים : 250.75 MiB

  • שמירה אוטומטית במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 2,000
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (6,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
מדרגות/תצפית/גובה מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/אוריינטציות מוֹתֵחַ (14,) לצוף32
צעדים/תצפית/מהירות מוֹתֵחַ (9,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/walker_walk_combined_challenge_none_100_percent

  • גודל ערכת נתונים: 626.86 MiB

  • שמירה אוטומטית במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 5,000
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (6,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
מדרגות/תצפית/גובה מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/אוריינטציות מוֹתֵחַ (14,) לצוף32
צעדים/תצפית/מהירות מוֹתֵחַ (9,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/humanoid_walk_combined_challenge_none_1_percent

  • גודל מערך נתונים : 69.40 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 200
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (21,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/מהירות_תנועה מוֹתֵחַ (3,) לצוף32
צעדים/תצפית/הקצנות מוֹתֵחַ (12,) לצוף32
צעדים/תצפית/גובה_ראש מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/זוויות_מפרק מוֹתֵחַ (21,) לצוף32
צעדים/תצפית/טורסו_אנכי מוֹתֵחַ (3,) לצוף32
צעדים/תצפית/מהירות מוֹתֵחַ (27,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/humanoid_walk_combined_challenge_none_5_percent

  • גודל ערכת נתונים: 346.98 MiB

  • שמירה אוטומטית במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 1,000
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (21,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/מהירות_תנועה מוֹתֵחַ (3,) לצוף32
צעדים/תצפית/הקצנות מוֹתֵחַ (12,) לצוף32
צעדים/תצפית/גובה_ראש מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/זוויות_מפרק מוֹתֵחַ (21,) לצוף32
צעדים/תצפית/טורסו_אנכי מוֹתֵחַ (3,) לצוף32
צעדים/תצפית/מהירות מוֹתֵחַ (27,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/humanoid_walk_combined_challenge_none_20_percent

  • גודל ערכת נתונים : 1.36 GiB

  • שמירה אוטומטית במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 4,000
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (21,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/מהירות_תנועה מוֹתֵחַ (3,) לצוף32
צעדים/תצפית/הקצנות מוֹתֵחַ (12,) לצוף32
צעדים/תצפית/גובה_ראש מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/זוויות_מפרק מוֹתֵחַ (21,) לצוף32
צעדים/תצפית/טורסו_אנכי מוֹתֵחַ (3,) לצוף32
צעדים/תצפית/מהירות מוֹתֵחַ (27,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/humanoid_walk_combined_challenge_none_40_percent

  • גודל ערכת נתונים : 2.71 GiB

  • שמירה אוטומטית במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 8,000
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (21,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/מהירות_תנועה מוֹתֵחַ (3,) לצוף32
צעדים/תצפית/הקצנות מוֹתֵחַ (12,) לצוף32
צעדים/תצפית/גובה_ראש מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/זוויות_מפרק מוֹתֵחַ (21,) לצוף32
צעדים/תצפית/טורסו_אנכי מוֹתֵחַ (3,) לצוף32
צעדים/תצפית/מהירות מוֹתֵחַ (27,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/humanoid_walk_combined_challenge_none_100_percent

  • גודל מערך נתונים : 6.78 GiB

  • שמירה אוטומטית במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 20,000
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (21,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/מהירות_תנועה מוֹתֵחַ (3,) לצוף32
צעדים/תצפית/הקצנות מוֹתֵחַ (12,) לצוף32
צעדים/תצפית/גובה_ראש מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/זוויות_מפרק מוֹתֵחַ (21,) לצוף32
צעדים/תצפית/טורסו_אנכי מוֹתֵחַ (3,) לצוף32
צעדים/תצפית/מהירות מוֹתֵחַ (27,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_1_percent

  • גודל ערכת נתונים: 369.84 KiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 5
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (1,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/דמה-0 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-1 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-2 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-3 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-4 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-5 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-6 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-7 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-8 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-9 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/עמדה מוֹתֵחַ (3,) לצוף32
צעדים/תצפית/מהירות מוֹתֵחַ (2,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_5_percent

  • גודל מערך נתונים : 1.81 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 25
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (1,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/דמה-0 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-1 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-2 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-3 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-4 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-5 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-6 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-7 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-8 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-9 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/עמדה מוֹתֵחַ (3,) לצוף32
צעדים/תצפית/מהירות מוֹתֵחַ (2,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_20_percent

  • גודל מערך נתונים : 7.22 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 100
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (1,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/דמה-0 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-1 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-2 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-3 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-4 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-5 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-6 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-7 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-8 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-9 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/עמדה מוֹתֵחַ (3,) לצוף32
צעדים/תצפית/מהירות מוֹתֵחַ (2,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_40_percent

  • גודל מערך נתונים : 14.45 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 200
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (1,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/דמה-0 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-1 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-2 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-3 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-4 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-5 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-6 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-7 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-8 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-9 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/עמדה מוֹתֵחַ (3,) לצוף32
צעדים/תצפית/מהירות מוֹתֵחַ (2,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_100_percent

  • גודל מערך נתונים : 36.12 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 500
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (1,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/דמה-0 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-1 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-2 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-3 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-4 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-5 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-6 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-7 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-8 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-9 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/עמדה מוֹתֵחַ (3,) לצוף32
צעדים/תצפית/מהירות מוֹתֵחַ (2,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/quadruped_walk_combined_challenge_easy_1_percent

  • גודל מערך נתונים : 1.97 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 5
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (12,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/דמה-0 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-1 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-2 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-3 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-4 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-5 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-6 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-7 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-8 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-9 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/מצב_אגוצנטריים מוֹתֵחַ (44,) לצוף32
צעדים/תצפית/כוח_מומנט מוֹתֵחַ (24,) לצוף32
צעדים/תצפית/אימו מוֹתֵחַ (6,) לצוף32
צעדים/התבוננות/טורסו_זקוף מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/מהירות_גו מוֹתֵחַ (3,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/quadruped_walk_combined_challenge_easy_5_percent

  • גודל ערכת נתונים : 9.83 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 25
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (12,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/דמה-0 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-1 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-2 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-3 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-4 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-5 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-6 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-7 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-8 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-9 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/מצב_אגוצנטריים מוֹתֵחַ (44,) לצוף32
צעדים/תצפית/כוח_מומנט מוֹתֵחַ (24,) לצוף32
צעדים/תצפית/אימו מוֹתֵחַ (6,) לצוף32
צעדים/התבוננות/טורסו_זקוף מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/מהירות_גו מוֹתֵחַ (3,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/quadruped_walk_combined_challenge_easy_20_percent

  • גודל ערכת נתונים: 39.31 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 100
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (12,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/דמה-0 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-1 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-2 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-3 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-4 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-5 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-6 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-7 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-8 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-9 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/מצב_אגוצנטריים מוֹתֵחַ (44,) לצוף32
צעדים/תצפית/כוח_מומנט מוֹתֵחַ (24,) לצוף32
צעדים/תצפית/אימו מוֹתֵחַ (6,) לצוף32
צעדים/התבוננות/טורסו_זקוף מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/מהירות_גו מוֹתֵחַ (3,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/quadruped_walk_combined_challenge_easy_40_percent

  • גודל מערך נתונים : 78.63 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 200
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (12,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/דמה-0 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-1 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-2 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-3 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-4 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-5 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-6 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-7 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-8 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-9 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/מצב_אגוצנטריים מוֹתֵחַ (44,) לצוף32
צעדים/תצפית/כוח_מומנט מוֹתֵחַ (24,) לצוף32
צעדים/תצפית/אימו מוֹתֵחַ (6,) לצוף32
צעדים/התבוננות/טורסו_זקוף מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/מהירות_גו מוֹתֵחַ (3,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/quadruped_walk_combined_challenge_easy_100_percent

  • גודל מערך נתונים : 196.57 MiB

  • שמור אוטומטי במטמון ( תיעוד ): רק כאשר shuffle_files=False (רכבת)

  • פיצולים :

לְפַצֵל דוגמאות
'train' 500
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (12,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/דמה-0 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-1 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-2 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-3 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-4 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-5 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-6 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-7 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-8 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-9 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/מצב_אגוצנטריים מוֹתֵחַ (44,) לצוף32
צעדים/תצפית/כוח_מומנט מוֹתֵחַ (24,) לצוף32
צעדים/תצפית/אימו מוֹתֵחַ (6,) לצוף32
צעדים/התבוננות/טורסו_זקוף מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/מהירות_גו מוֹתֵחַ (3,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/walker_walk_combined_challenge_easy_1_percent

  • גודל מערך נתונים : 8.20 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 50
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (6,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/דמה-0 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-1 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-2 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-3 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-4 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-5 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-6 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-7 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-8 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-9 מוֹתֵחַ (1,) לצוף32
מדרגות/תצפית/גובה מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/אוריינטציות מוֹתֵחַ (14,) לצוף32
צעדים/תצפית/מהירות מוֹתֵחַ (9,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/walker_walk_combined_challenge_easy_5_percent

  • גודל מערך נתונים : 40.98 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 250
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (6,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/דמה-0 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-1 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-2 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-3 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-4 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-5 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-6 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-7 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-8 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-9 מוֹתֵחַ (1,) לצוף32
מדרגות/תצפית/גובה מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/אוריינטציות מוֹתֵחַ (14,) לצוף32
צעדים/תצפית/מהירות מוֹתֵחַ (9,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/walker_walk_combined_challenge_easy_20_percent

  • גודל ערכת נתונים: 163.93 MiB

  • שמור אוטומטי במטמון ( תיעוד ): רק כאשר shuffle_files=False (רכבת)

  • פיצולים :

לְפַצֵל דוגמאות
'train' 1,000
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (6,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/דמה-0 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-1 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-2 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-3 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-4 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-5 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-6 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-7 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-8 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-9 מוֹתֵחַ (1,) לצוף32
מדרגות/תצפית/גובה מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/אוריינטציות מוֹתֵחַ (14,) לצוף32
צעדים/תצפית/מהירות מוֹתֵחַ (9,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/walker_walk_combined_challenge_easy_40_percent

  • גודל ערכת נתונים: 327.86 MiB

  • שמירה אוטומטית במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 2,000
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (6,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/דמה-0 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-1 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-2 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-3 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-4 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-5 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-6 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-7 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-8 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-9 מוֹתֵחַ (1,) לצוף32
מדרגות/תצפית/גובה מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/אוריינטציות מוֹתֵחַ (14,) לצוף32
צעדים/תצפית/מהירות מוֹתֵחַ (9,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/walker_walk_combined_challenge_easy_100_percent

  • גודל ערכת נתונים: 819.65 MiB

  • שמירה אוטומטית במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 5,000
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (6,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/דמה-0 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-1 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-2 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-3 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-4 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-5 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-6 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-7 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-8 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-9 מוֹתֵחַ (1,) לצוף32
מדרגות/תצפית/גובה מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/אוריינטציות מוֹתֵחַ (14,) לצוף32
צעדים/תצפית/מהירות מוֹתֵחַ (9,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/humanoid_walk_combined_challenge_easy_1_percent

  • גודל ערכת נתונים: 77.11 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 200
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (21,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/מהירות_תנועה מוֹתֵחַ (3,) לצוף32
צעדים/תצפית/דמה-0 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-1 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-2 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-3 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-4 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-5 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-6 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-7 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-8 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-9 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/הקצנות מוֹתֵחַ (12,) לצוף32
צעדים/תצפית/גובה_ראש מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/זוויות_מפרק מוֹתֵחַ (21,) לצוף32
צעדים/תצפית/טורסו_אנכי מוֹתֵחַ (3,) לצוף32
צעדים/תצפית/מהירות מוֹתֵחַ (27,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/humanoid_walk_combined_challenge_easy_5_percent

  • גודל ערכת נתונים: 385.54 MiB

  • שמירה אוטומטית במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 1,000
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (21,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/מהירות_תנועה מוֹתֵחַ (3,) לצוף32
צעדים/תצפית/דמה-0 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-1 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-2 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-3 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-4 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-5 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-6 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-7 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-8 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-9 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/הקצנות מוֹתֵחַ (12,) לצוף32
צעדים/תצפית/גובה_ראש מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/זוויות_מפרק מוֹתֵחַ (21,) לצוף32
צעדים/תצפית/טורסו_אנכי מוֹתֵחַ (3,) לצוף32
צעדים/תצפית/מהירות מוֹתֵחַ (27,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/humanoid_walk_combined_challenge_easy_20_percent

  • גודל מערך נתונים : 1.51 GiB

  • שמירה אוטומטית במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 4,000
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (21,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/מהירות_תנועה מוֹתֵחַ (3,) לצוף32
צעדים/תצפית/דמה-0 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-1 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-2 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-3 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-4 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-5 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-6 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-7 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-8 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-9 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/הקצנות מוֹתֵחַ (12,) לצוף32
צעדים/תצפית/גובה_ראש מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/זוויות_מפרק מוֹתֵחַ (21,) לצוף32
צעדים/תצפית/טורסו_אנכי מוֹתֵחַ (3,) לצוף32
צעדים/תצפית/מהירות מוֹתֵחַ (27,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/humanoid_walk_combined_challenge_easy_40_percent

  • גודל מערך נתונים : 3.01 GiB

  • שמירה אוטומטית במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 8,000
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (21,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/מהירות_תנועה מוֹתֵחַ (3,) לצוף32
צעדים/תצפית/דמה-0 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-1 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-2 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-3 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-4 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-5 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-6 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-7 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-8 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-9 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/הקצנות מוֹתֵחַ (12,) לצוף32
צעדים/תצפית/גובה_ראש מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/זוויות_מפרק מוֹתֵחַ (21,) לצוף32
צעדים/תצפית/טורסו_אנכי מוֹתֵחַ (3,) לצוף32
צעדים/תצפית/מהירות מוֹתֵחַ (27,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32

rlu_rwrl/humanoid_walk_combined_challenge_easy_100_percent

  • גודל מערך נתונים : 7.53 GiB

  • שמירה אוטומטית במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 20,000
  • מבנה תכונה :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ לצוף32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (21,) לצוף32
צעדים/הנחה מוֹתֵחַ (1,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/מהירות_תנועה מוֹתֵחַ (3,) לצוף32
צעדים/תצפית/דמה-0 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-1 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-2 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-3 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-4 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-5 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-6 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-7 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-8 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/דמה-9 מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/הקצנות מוֹתֵחַ (12,) לצוף32
צעדים/תצפית/גובה_ראש מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/זוויות_מפרק מוֹתֵחַ (21,) לצוף32
צעדים/תצפית/טורסו_אנכי מוֹתֵחַ (3,) לצוף32
צעדים/תצפית/מהירות מוֹתֵחַ (27,) לצוף32
צעדים/פרס מוֹתֵחַ (1,) לצוף32