rlu_rwrl

  • תיאור :

RL Unplugged היא חבילת אמות מידה ללימוד חיזוק לא מקוון. ה-RL Unplugged מתוכנן סביב השיקולים הבאים: כדי להקל על השימוש, אנו מספקים למערכי הנתונים API מאוחד אשר מקל על המתרגל לעבוד עם כל הנתונים בחבילה לאחר הקמת צינור כללי.

מערכי הנתונים פועלים לפי פורמט RLDS כדי לייצג שלבים ופרקים.

דוגמאות במערך הנתונים מייצגות מעברי SAR המאוחסנים בעת הפעלת סוכן מאומן מקוון חלקית כמתואר ב- https://arxiv.org/abs/1904.12901 אנו פועלים לפי פורמט מערך הנתונים של RLDS, כפי שצוין ב- https://github.com/google-research /rlds#dataset-format

אנו משחררים 40 מערכי נתונים על 8 משימות בסך הכל -- ללא אתגר משולב ואתגר משולב קל על המשימות של עמוד העגלה, ההליכון, מרובע ומשימות דמוי אדם. כל משימה מכילה 5 גדלים שונים של מערכי נתונים, 1%, 5%, 20%, 40% ו-100%. שים לב שלא מובטח שמערך הנתונים הקטן יותר הוא תת-קבוצה של הגדולים יותר. לפרטים על אופן יצירת מערך הנתונים, עיין במאמר.

@misc{gulcehre2020rl,
    title={RL Unplugged: Benchmarks for Offline Reinforcement Learning},
    author={Caglar Gulcehre and Ziyu Wang and Alexander Novikov and Tom Le Paine
        and  Sergio Gómez Colmenarejo and Konrad Zolna and Rishabh Agarwal and
        Josh Merel and Daniel Mankowitz and Cosmin Paduraru and Gabriel
        Dulac-Arnold and Jerry Li and Mohammad Norouzi and Matt Hoffman and
        Ofir Nachum and George Tucker and Nicolas Heess and Nando deFreitas},
    year={2020},
    eprint={2006.13888},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

rlu_rwrl/cartpole_swingup_combined_challenge_none_1_percent (תצורת ברירת המחדל)

  • גודל מערך נתונים : 172.43 KiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 5
  • מבנה תכונה :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(2,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ tf.float32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (1,) tf.float32
צעדים/הנחה מוֹתֵחַ (1,) tf.float32
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/עמדה מוֹתֵחַ (3,) tf.float32
צעדים/תצפית/מהירות מוֹתֵחַ (2,) tf.float32
צעדים/פרס מוֹתֵחַ (1,) tf.float32

rlu_rwrl/cartpole_swingup_combined_challenge_none_5_percent

  • גודל מערך נתונים : 862.13 KiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 25
  • מבנה תכונה :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(2,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ tf.float32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (1,) tf.float32
צעדים/הנחה מוֹתֵחַ (1,) tf.float32
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/עמדה מוֹתֵחַ (3,) tf.float32
צעדים/תצפית/מהירות מוֹתֵחַ (2,) tf.float32
צעדים/פרס מוֹתֵחַ (1,) tf.float32

rlu_rwrl/cartpole_swingup_combined_challenge_none_20_percent

  • גודל מערך נתונים : 3.37 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 100
  • מבנה תכונה :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(2,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ tf.float32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (1,) tf.float32
צעדים/הנחה מוֹתֵחַ (1,) tf.float32
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/עמדה מוֹתֵחַ (3,) tf.float32
צעדים/תצפית/מהירות מוֹתֵחַ (2,) tf.float32
צעדים/פרס מוֹתֵחַ (1,) tf.float32

rlu_rwrl/cartpole_swingup_combined_challenge_none_40_percent

  • גודל ערכת נתונים : 6.74 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 200
  • מבנה תכונה :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(2,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ tf.float32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (1,) tf.float32
צעדים/הנחה מוֹתֵחַ (1,) tf.float32
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/עמדה מוֹתֵחַ (3,) tf.float32
צעדים/תצפית/מהירות מוֹתֵחַ (2,) tf.float32
צעדים/פרס מוֹתֵחַ (1,) tf.float32

rlu_rwrl/cartpole_swingup_combined_challenge_none_100_percent

  • גודל ערכת נתונים : 16.84 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 500
  • מבנה תכונה :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(2,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ tf.float32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (1,) tf.float32
צעדים/הנחה מוֹתֵחַ (1,) tf.float32
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/עמדה מוֹתֵחַ (3,) tf.float32
צעדים/תצפית/מהירות מוֹתֵחַ (2,) tf.float32
צעדים/פרס מוֹתֵחַ (1,) tf.float32

rlu_rwrl/quadruped_walk_combined_challenge_none_1_percent

  • גודל ערכת נתונים : 1.77 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 5
  • מבנה תכונה :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=tf.float32),
            'force_torque': Tensor(shape=(24,), dtype=tf.float32),
            'imu': Tensor(shape=(6,), dtype=tf.float32),
            'torso_upright': Tensor(shape=(1,), dtype=tf.float32),
            'torso_velocity': Tensor(shape=(3,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ tf.float32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (12,) tf.float32
צעדים/הנחה מוֹתֵחַ (1,) tf.float32
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/מצב_אגוצנטריים מוֹתֵחַ (44,) tf.float32
צעדים/תצפית/כוח_מומנט מוֹתֵחַ (24,) tf.float32
צעדים/תצפית/אימו מוֹתֵחַ (6,) tf.float32
צעדים/התבוננות/טורסו_זקוף מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/מהירות_גו מוֹתֵחַ (3,) tf.float32
צעדים/פרס מוֹתֵחַ (1,) tf.float32

rlu_rwrl/quadruped_walk_combined_challenge_none_5_percent

  • גודל מערך נתונים : 8.86 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 25
  • מבנה תכונה :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=tf.float32),
            'force_torque': Tensor(shape=(24,), dtype=tf.float32),
            'imu': Tensor(shape=(6,), dtype=tf.float32),
            'torso_upright': Tensor(shape=(1,), dtype=tf.float32),
            'torso_velocity': Tensor(shape=(3,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ tf.float32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (12,) tf.float32
צעדים/הנחה מוֹתֵחַ (1,) tf.float32
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/מצב_אגוצנטריים מוֹתֵחַ (44,) tf.float32
צעדים/תצפית/כוח_מומנט מוֹתֵחַ (24,) tf.float32
צעדים/תצפית/אימו מוֹתֵחַ (6,) tf.float32
צעדים/התבוננות/טורסו_זקוף מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/מהירות_גו מוֹתֵחַ (3,) tf.float32
צעדים/פרס מוֹתֵחַ (1,) tf.float32

rlu_rwrl/quadruped_walk_combined_challenge_none_20_percent

  • גודל מערך נתונים : 35.46 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 100
  • מבנה תכונה :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=tf.float32),
            'force_torque': Tensor(shape=(24,), dtype=tf.float32),
            'imu': Tensor(shape=(6,), dtype=tf.float32),
            'torso_upright': Tensor(shape=(1,), dtype=tf.float32),
            'torso_velocity': Tensor(shape=(3,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ tf.float32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (12,) tf.float32
צעדים/הנחה מוֹתֵחַ (1,) tf.float32
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/מצב_אגוצנטריים מוֹתֵחַ (44,) tf.float32
צעדים/תצפית/כוח_מומנט מוֹתֵחַ (24,) tf.float32
צעדים/תצפית/אימו מוֹתֵחַ (6,) tf.float32
צעדים/התבוננות/טורסו_זקוף מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/מהירות_גו מוֹתֵחַ (3,) tf.float32
צעדים/פרס מוֹתֵחַ (1,) tf.float32

rlu_rwrl/quadruped_walk_combined_challenge_none_40_percent

  • גודל מערך נתונים : 70.92 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 200
  • מבנה תכונה :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=tf.float32),
            'force_torque': Tensor(shape=(24,), dtype=tf.float32),
            'imu': Tensor(shape=(6,), dtype=tf.float32),
            'torso_upright': Tensor(shape=(1,), dtype=tf.float32),
            'torso_velocity': Tensor(shape=(3,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ tf.float32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (12,) tf.float32
צעדים/הנחה מוֹתֵחַ (1,) tf.float32
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/מצב_אגוצנטריים מוֹתֵחַ (44,) tf.float32
צעדים/תצפית/כוח_מומנט מוֹתֵחַ (24,) tf.float32
צעדים/תצפית/אימו מוֹתֵחַ (6,) tf.float32
צעדים/התבוננות/טורסו_זקוף מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/מהירות_גו מוֹתֵחַ (3,) tf.float32
צעדים/פרס מוֹתֵחַ (1,) tf.float32

rlu_rwrl/quadruped_walk_combined_challenge_none_100_percent

  • גודל ערכת נתונים: 177.29 MiB

  • שמור אוטומטי במטמון ( תיעוד ): רק כאשר shuffle_files=False (רכבת)

  • פיצולים :

לְפַצֵל דוגמאות
'train' 500
  • מבנה תכונה :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=tf.float32),
            'force_torque': Tensor(shape=(24,), dtype=tf.float32),
            'imu': Tensor(shape=(6,), dtype=tf.float32),
            'torso_upright': Tensor(shape=(1,), dtype=tf.float32),
            'torso_velocity': Tensor(shape=(3,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ tf.float32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (12,) tf.float32
צעדים/הנחה מוֹתֵחַ (1,) tf.float32
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/מצב_אגוצנטריים מוֹתֵחַ (44,) tf.float32
צעדים/תצפית/כוח_מומנט מוֹתֵחַ (24,) tf.float32
צעדים/תצפית/אימו מוֹתֵחַ (6,) tf.float32
צעדים/התבוננות/טורסו_זקוף מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/מהירות_גו מוֹתֵחַ (3,) tf.float32
צעדים/פרס מוֹתֵחַ (1,) tf.float32

rlu_rwrl/walker_walk_combined_challenge_none_1_percent

  • גודל מערך נתונים : 6.27 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 50
  • מבנה תכונה :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=tf.float32),
            'orientations': Tensor(shape=(14,), dtype=tf.float32),
            'velocity': Tensor(shape=(9,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ tf.float32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (6,) tf.float32
צעדים/הנחה מוֹתֵחַ (1,) tf.float32
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית FeaturesDict
מדרגות/תצפית/גובה מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/אוריינטציות מוֹתֵחַ (14,) tf.float32
צעדים/תצפית/מהירות מוֹתֵחַ (9,) tf.float32
צעדים/פרס מוֹתֵחַ (1,) tf.float32

rlu_rwrl/walker_walk_combined_challenge_none_5_percent

  • גודל מערך נתונים : 31.34 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 250
  • מבנה תכונה :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=tf.float32),
            'orientations': Tensor(shape=(14,), dtype=tf.float32),
            'velocity': Tensor(shape=(9,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ tf.float32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (6,) tf.float32
צעדים/הנחה מוֹתֵחַ (1,) tf.float32
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית FeaturesDict
מדרגות/תצפית/גובה מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/אוריינטציות מוֹתֵחַ (14,) tf.float32
צעדים/תצפית/מהירות מוֹתֵחַ (9,) tf.float32
צעדים/פרס מוֹתֵחַ (1,) tf.float32

rlu_rwrl/walker_walk_combined_challenge_none_20_percent

  • גודל מערך נתונים : 125.37 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 1,000
  • מבנה תכונה :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=tf.float32),
            'orientations': Tensor(shape=(14,), dtype=tf.float32),
            'velocity': Tensor(shape=(9,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ tf.float32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (6,) tf.float32
צעדים/הנחה מוֹתֵחַ (1,) tf.float32
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית FeaturesDict
מדרגות/תצפית/גובה מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/אוריינטציות מוֹתֵחַ (14,) tf.float32
צעדים/תצפית/מהירות מוֹתֵחַ (9,) tf.float32
צעדים/פרס מוֹתֵחַ (1,) tf.float32

rlu_rwrl/walker_walk_combined_challenge_none_40_percent

  • גודל מערך נתונים : 250.75 MiB

  • שמור אוטומטי במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 2,000
  • מבנה תכונה :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=tf.float32),
            'orientations': Tensor(shape=(14,), dtype=tf.float32),
            'velocity': Tensor(shape=(9,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ tf.float32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (6,) tf.float32
צעדים/הנחה מוֹתֵחַ (1,) tf.float32
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית FeaturesDict
מדרגות/תצפית/גובה מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/אוריינטציות מוֹתֵחַ (14,) tf.float32
צעדים/תצפית/מהירות מוֹתֵחַ (9,) tf.float32
צעדים/פרס מוֹתֵחַ (1,) tf.float32

rlu_rwrl/walker_walk_combined_challenge_none_100_percent

  • גודל מערך נתונים : 626.86 MiB

  • שמור אוטומטי במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 5,000
  • מבנה תכונה :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=tf.float32),
            'orientations': Tensor(shape=(14,), dtype=tf.float32),
            'velocity': Tensor(shape=(9,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ tf.float32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (6,) tf.float32
צעדים/הנחה מוֹתֵחַ (1,) tf.float32
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית FeaturesDict
מדרגות/תצפית/גובה מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/אוריינטציות מוֹתֵחַ (14,) tf.float32
צעדים/תצפית/מהירות מוֹתֵחַ (9,) tf.float32
צעדים/פרס מוֹתֵחַ (1,) tf.float32

rlu_rwrl/humanoid_walk_combined_challenge_none_1_percent

  • גודל מערך נתונים : 69.40 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 200
  • מבנה תכונה :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=tf.float32),
            'extremities': Tensor(shape=(12,), dtype=tf.float32),
            'head_height': Tensor(shape=(1,), dtype=tf.float32),
            'joint_angles': Tensor(shape=(21,), dtype=tf.float32),
            'torso_vertical': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(27,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ tf.float32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (21,) tf.float32
צעדים/הנחה מוֹתֵחַ (1,) tf.float32
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/מהירות_תנועה מוֹתֵחַ (3,) tf.float32
צעדים/תצפית/הקצנות מוֹתֵחַ (12,) tf.float32
צעדים/תצפית/גובה_ראש מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/זוויות_מפרק מוֹתֵחַ (21,) tf.float32
צעדים/תצפית/טורסו_אנכי מוֹתֵחַ (3,) tf.float32
צעדים/תצפית/מהירות מוֹתֵחַ (27,) tf.float32
צעדים/פרס מוֹתֵחַ (1,) tf.float32

rlu_rwrl/humanoid_walk_combined_challenge_none_5_percent

  • גודל ערכת נתונים: 346.98 MiB

  • שמור אוטומטי במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 1,000
  • מבנה תכונה :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=tf.float32),
            'extremities': Tensor(shape=(12,), dtype=tf.float32),
            'head_height': Tensor(shape=(1,), dtype=tf.float32),
            'joint_angles': Tensor(shape=(21,), dtype=tf.float32),
            'torso_vertical': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(27,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ tf.float32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (21,) tf.float32
צעדים/הנחה מוֹתֵחַ (1,) tf.float32
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/מהירות_תנועה מוֹתֵחַ (3,) tf.float32
צעדים/תצפית/הקצנות מוֹתֵחַ (12,) tf.float32
צעדים/תצפית/גובה_ראש מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/זוויות_מפרק מוֹתֵחַ (21,) tf.float32
צעדים/תצפית/טורסו_אנכי מוֹתֵחַ (3,) tf.float32
צעדים/תצפית/מהירות מוֹתֵחַ (27,) tf.float32
צעדים/פרס מוֹתֵחַ (1,) tf.float32

rlu_rwrl/humanoid_walk_combined_challenge_none_20_percent

  • גודל מערך נתונים : 1.36 GiB

  • שמור אוטומטי במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 4,000
  • מבנה תכונה :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=tf.float32),
            'extremities': Tensor(shape=(12,), dtype=tf.float32),
            'head_height': Tensor(shape=(1,), dtype=tf.float32),
            'joint_angles': Tensor(shape=(21,), dtype=tf.float32),
            'torso_vertical': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(27,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ tf.float32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (21,) tf.float32
צעדים/הנחה מוֹתֵחַ (1,) tf.float32
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/מהירות_תנועה מוֹתֵחַ (3,) tf.float32
צעדים/תצפית/הקצנות מוֹתֵחַ (12,) tf.float32
צעדים/תצפית/גובה_ראש מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/זוויות_מפרק מוֹתֵחַ (21,) tf.float32
צעדים/תצפית/טורסו_אנכי מוֹתֵחַ (3,) tf.float32
צעדים/תצפית/מהירות מוֹתֵחַ (27,) tf.float32
צעדים/פרס מוֹתֵחַ (1,) tf.float32

rlu_rwrl/humanoid_walk_combined_challenge_none_40_percent

  • גודל מערך נתונים : 2.71 GiB

  • שמור אוטומטי במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 8,000
  • מבנה תכונה :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=tf.float32),
            'extremities': Tensor(shape=(12,), dtype=tf.float32),
            'head_height': Tensor(shape=(1,), dtype=tf.float32),
            'joint_angles': Tensor(shape=(21,), dtype=tf.float32),
            'torso_vertical': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(27,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ tf.float32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (21,) tf.float32
צעדים/הנחה מוֹתֵחַ (1,) tf.float32
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/מהירות_תנועה מוֹתֵחַ (3,) tf.float32
צעדים/תצפית/הקצנות מוֹתֵחַ (12,) tf.float32
צעדים/תצפית/גובה_ראש מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/זוויות_מפרק מוֹתֵחַ (21,) tf.float32
צעדים/תצפית/טורסו_אנכי מוֹתֵחַ (3,) tf.float32
צעדים/תצפית/מהירות מוֹתֵחַ (27,) tf.float32
צעדים/פרס מוֹתֵחַ (1,) tf.float32

rlu_rwrl/humanoid_walk_combined_challenge_none_100_percent

  • גודל מערך נתונים : 6.78 GiB

  • שמור אוטומטי במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 20,000
  • מבנה תכונה :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=tf.float32),
            'extremities': Tensor(shape=(12,), dtype=tf.float32),
            'head_height': Tensor(shape=(1,), dtype=tf.float32),
            'joint_angles': Tensor(shape=(21,), dtype=tf.float32),
            'torso_vertical': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(27,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ tf.float32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (21,) tf.float32
צעדים/הנחה מוֹתֵחַ (1,) tf.float32
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/מהירות_תנועה מוֹתֵחַ (3,) tf.float32
צעדים/תצפית/הקצנות מוֹתֵחַ (12,) tf.float32
צעדים/תצפית/גובה_ראש מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/זוויות_מפרק מוֹתֵחַ (21,) tf.float32
צעדים/תצפית/טורסו_אנכי מוֹתֵחַ (3,) tf.float32
צעדים/תצפית/מהירות מוֹתֵחַ (27,) tf.float32
צעדים/פרס מוֹתֵחַ (1,) tf.float32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_1_percent

  • גודל מערך נתונים : 369.84 KiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 5
  • מבנה תכונה :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'position': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(2,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ tf.float32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (1,) tf.float32
צעדים/הנחה מוֹתֵחַ (1,) tf.float32
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/דמה-0 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-1 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-2 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-3 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-4 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-5 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-6 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-7 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-8 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-9 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/עמדה מוֹתֵחַ (3,) tf.float32
צעדים/תצפית/מהירות מוֹתֵחַ (2,) tf.float32
צעדים/פרס מוֹתֵחַ (1,) tf.float32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_5_percent

  • גודל ערכת נתונים : 1.81 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 25
  • מבנה תכונה :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'position': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(2,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ tf.float32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (1,) tf.float32
צעדים/הנחה מוֹתֵחַ (1,) tf.float32
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/דמה-0 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-1 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-2 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-3 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-4 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-5 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-6 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-7 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-8 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-9 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/עמדה מוֹתֵחַ (3,) tf.float32
צעדים/תצפית/מהירות מוֹתֵחַ (2,) tf.float32
צעדים/פרס מוֹתֵחַ (1,) tf.float32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_20_percent

  • גודל מערך נתונים : 7.22 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 100
  • מבנה תכונה :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'position': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(2,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ tf.float32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (1,) tf.float32
צעדים/הנחה מוֹתֵחַ (1,) tf.float32
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/דמה-0 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-1 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-2 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-3 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-4 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-5 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-6 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-7 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-8 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-9 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/עמדה מוֹתֵחַ (3,) tf.float32
צעדים/תצפית/מהירות מוֹתֵחַ (2,) tf.float32
צעדים/פרס מוֹתֵחַ (1,) tf.float32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_40_percent

  • גודל ערכת נתונים : 14.45 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 200
  • מבנה תכונה :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'position': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(2,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ tf.float32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (1,) tf.float32
צעדים/הנחה מוֹתֵחַ (1,) tf.float32
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/דמה-0 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-1 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-2 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-3 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-4 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-5 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-6 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-7 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-8 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-9 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/עמדה מוֹתֵחַ (3,) tf.float32
צעדים/תצפית/מהירות מוֹתֵחַ (2,) tf.float32
צעדים/פרס מוֹתֵחַ (1,) tf.float32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_100_percent

  • גודל מערך נתונים : 36.12 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 500
  • מבנה תכונה :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'position': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(2,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ tf.float32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (1,) tf.float32
צעדים/הנחה מוֹתֵחַ (1,) tf.float32
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/דמה-0 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-1 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-2 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-3 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-4 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-5 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-6 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-7 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-8 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-9 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/עמדה מוֹתֵחַ (3,) tf.float32
צעדים/תצפית/מהירות מוֹתֵחַ (2,) tf.float32
צעדים/פרס מוֹתֵחַ (1,) tf.float32

rlu_rwrl/quadruped_walk_combined_challenge_easy_1_percent

  • גודל מערך נתונים : 1.97 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 5
  • מבנה תכונה :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'egocentric_state': Tensor(shape=(44,), dtype=tf.float32),
            'force_torque': Tensor(shape=(24,), dtype=tf.float32),
            'imu': Tensor(shape=(6,), dtype=tf.float32),
            'torso_upright': Tensor(shape=(1,), dtype=tf.float32),
            'torso_velocity': Tensor(shape=(3,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ tf.float32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (12,) tf.float32
צעדים/הנחה מוֹתֵחַ (1,) tf.float32
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/דמה-0 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-1 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-2 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-3 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-4 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-5 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-6 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-7 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-8 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-9 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/מצב_אגוצנטריים מוֹתֵחַ (44,) tf.float32
צעדים/תצפית/כוח_מומנט מוֹתֵחַ (24,) tf.float32
צעדים/תצפית/אימו מוֹתֵחַ (6,) tf.float32
צעדים/התבוננות/טורסו_זקוף מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/מהירות_גו מוֹתֵחַ (3,) tf.float32
צעדים/פרס מוֹתֵחַ (1,) tf.float32

rlu_rwrl/quadruped_walk_combined_challenge_easy_5_percent

  • גודל ערכת נתונים : 9.83 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 25
  • מבנה תכונה :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'egocentric_state': Tensor(shape=(44,), dtype=tf.float32),
            'force_torque': Tensor(shape=(24,), dtype=tf.float32),
            'imu': Tensor(shape=(6,), dtype=tf.float32),
            'torso_upright': Tensor(shape=(1,), dtype=tf.float32),
            'torso_velocity': Tensor(shape=(3,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ tf.float32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (12,) tf.float32
צעדים/הנחה מוֹתֵחַ (1,) tf.float32
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/דמה-0 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-1 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-2 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-3 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-4 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-5 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-6 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-7 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-8 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-9 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/מצב_אגוצנטריים מוֹתֵחַ (44,) tf.float32
צעדים/תצפית/כוח_מומנט מוֹתֵחַ (24,) tf.float32
צעדים/תצפית/אימו מוֹתֵחַ (6,) tf.float32
צעדים/התבוננות/טורסו_זקוף מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/מהירות_גו מוֹתֵחַ (3,) tf.float32
צעדים/פרס מוֹתֵחַ (1,) tf.float32

rlu_rwrl/quadruped_walk_combined_challenge_easy_20_percent

  • גודל ערכת נתונים: 39.31 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 100
  • מבנה תכונה :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'egocentric_state': Tensor(shape=(44,), dtype=tf.float32),
            'force_torque': Tensor(shape=(24,), dtype=tf.float32),
            'imu': Tensor(shape=(6,), dtype=tf.float32),
            'torso_upright': Tensor(shape=(1,), dtype=tf.float32),
            'torso_velocity': Tensor(shape=(3,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ tf.float32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (12,) tf.float32
צעדים/הנחה מוֹתֵחַ (1,) tf.float32
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/דמה-0 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-1 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-2 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-3 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-4 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-5 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-6 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-7 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-8 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-9 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/מצב_אגוצנטריים מוֹתֵחַ (44,) tf.float32
צעדים/תצפית/כוח_מומנט מוֹתֵחַ (24,) tf.float32
צעדים/תצפית/אימו מוֹתֵחַ (6,) tf.float32
צעדים/התבוננות/טורסו_זקוף מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/מהירות_גו מוֹתֵחַ (3,) tf.float32
צעדים/פרס מוֹתֵחַ (1,) tf.float32

rlu_rwrl/quadruped_walk_combined_challenge_easy_40_percent

  • גודל ערכת נתונים: 78.63 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 200
  • מבנה תכונה :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'egocentric_state': Tensor(shape=(44,), dtype=tf.float32),
            'force_torque': Tensor(shape=(24,), dtype=tf.float32),
            'imu': Tensor(shape=(6,), dtype=tf.float32),
            'torso_upright': Tensor(shape=(1,), dtype=tf.float32),
            'torso_velocity': Tensor(shape=(3,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ tf.float32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (12,) tf.float32
צעדים/הנחה מוֹתֵחַ (1,) tf.float32
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/דמה-0 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-1 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-2 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-3 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-4 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-5 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-6 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-7 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-8 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-9 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/מצב_אגוצנטריים מוֹתֵחַ (44,) tf.float32
צעדים/תצפית/כוח_מומנט מוֹתֵחַ (24,) tf.float32
צעדים/תצפית/אימו מוֹתֵחַ (6,) tf.float32
צעדים/התבוננות/טורסו_זקוף מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/מהירות_גו מוֹתֵחַ (3,) tf.float32
צעדים/פרס מוֹתֵחַ (1,) tf.float32

rlu_rwrl/quadruped_walk_combined_challenge_easy_100_percent

  • גודל ערכת נתונים: 196.57 MiB

  • שמור אוטומטי במטמון ( תיעוד ): רק כאשר shuffle_files=False (רכבת)

  • פיצולים :

לְפַצֵל דוגמאות
'train' 500
  • מבנה תכונה :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'egocentric_state': Tensor(shape=(44,), dtype=tf.float32),
            'force_torque': Tensor(shape=(24,), dtype=tf.float32),
            'imu': Tensor(shape=(6,), dtype=tf.float32),
            'torso_upright': Tensor(shape=(1,), dtype=tf.float32),
            'torso_velocity': Tensor(shape=(3,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ tf.float32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (12,) tf.float32
צעדים/הנחה מוֹתֵחַ (1,) tf.float32
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/דמה-0 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-1 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-2 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-3 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-4 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-5 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-6 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-7 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-8 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-9 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/מצב_אגוצנטריים מוֹתֵחַ (44,) tf.float32
צעדים/תצפית/כוח_מומנט מוֹתֵחַ (24,) tf.float32
צעדים/תצפית/אימו מוֹתֵחַ (6,) tf.float32
צעדים/התבוננות/טורסו_זקוף מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/מהירות_גו מוֹתֵחַ (3,) tf.float32
צעדים/פרס מוֹתֵחַ (1,) tf.float32

rlu_rwrl/walker_walk_combined_challenge_easy_1_percent

  • גודל מערך נתונים : 8.20 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 50
  • מבנה תכונה :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'height': Tensor(shape=(1,), dtype=tf.float32),
            'orientations': Tensor(shape=(14,), dtype=tf.float32),
            'velocity': Tensor(shape=(9,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ tf.float32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (6,) tf.float32
צעדים/הנחה מוֹתֵחַ (1,) tf.float32
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/דמה-0 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-1 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-2 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-3 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-4 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-5 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-6 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-7 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-8 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-9 מוֹתֵחַ (1,) tf.float32
מדרגות/תצפית/גובה מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/אוריינטציות מוֹתֵחַ (14,) tf.float32
צעדים/תצפית/מהירות מוֹתֵחַ (9,) tf.float32
צעדים/פרס מוֹתֵחַ (1,) tf.float32

rlu_rwrl/walker_walk_combined_challenge_easy_5_percent

  • גודל מערך נתונים : 40.98 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 250
  • מבנה תכונה :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'height': Tensor(shape=(1,), dtype=tf.float32),
            'orientations': Tensor(shape=(14,), dtype=tf.float32),
            'velocity': Tensor(shape=(9,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ tf.float32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (6,) tf.float32
צעדים/הנחה מוֹתֵחַ (1,) tf.float32
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/דמה-0 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-1 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-2 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-3 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-4 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-5 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-6 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-7 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-8 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-9 מוֹתֵחַ (1,) tf.float32
מדרגות/תצפית/גובה מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/אוריינטציות מוֹתֵחַ (14,) tf.float32
צעדים/תצפית/מהירות מוֹתֵחַ (9,) tf.float32
צעדים/פרס מוֹתֵחַ (1,) tf.float32

rlu_rwrl/walker_walk_combined_challenge_easy_20_percent

  • גודל ערכת נתונים: 163.93 MiB

  • שמור אוטומטי במטמון ( תיעוד ): רק כאשר shuffle_files=False (רכבת)

  • פיצולים :

לְפַצֵל דוגמאות
'train' 1,000
  • מבנה תכונה :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'height': Tensor(shape=(1,), dtype=tf.float32),
            'orientations': Tensor(shape=(14,), dtype=tf.float32),
            'velocity': Tensor(shape=(9,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ tf.float32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (6,) tf.float32
צעדים/הנחה מוֹתֵחַ (1,) tf.float32
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/דמה-0 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-1 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-2 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-3 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-4 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-5 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-6 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-7 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-8 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-9 מוֹתֵחַ (1,) tf.float32
מדרגות/תצפית/גובה מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/אוריינטציות מוֹתֵחַ (14,) tf.float32
צעדים/תצפית/מהירות מוֹתֵחַ (9,) tf.float32
צעדים/פרס מוֹתֵחַ (1,) tf.float32

rlu_rwrl/walker_walk_combined_challenge_easy_40_percent

  • גודל מערך נתונים : 327.86 MiB

  • שמור אוטומטי במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 2,000
  • מבנה תכונה :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'height': Tensor(shape=(1,), dtype=tf.float32),
            'orientations': Tensor(shape=(14,), dtype=tf.float32),
            'velocity': Tensor(shape=(9,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_return מוֹתֵחַ tf.float32
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (6,) tf.float32
צעדים/הנחה מוֹתֵחַ (1,) tf.float32
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית FeaturesDict
צעדים/תצפית/דמה-0 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-1 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-2 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-3 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-4 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-5 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-6 מוֹתֵחַ (1,) tf.float32
צעדים/תצפית/דמה-7 מוֹתֵחַ (1,) tf.float32
steps/observation/dummy-8 Tensor (1,) tf.float32
steps/observation/dummy-9 Tensor (1,) tf.float32
steps/observation/height Tensor (1,) tf.float32
steps/observation/orientations Tensor (14,) tf.float32
steps/observation/velocity Tensor (9,) tf.float32
steps/reward Tensor (1,) tf.float32

rlu_rwrl/walker_walk_combined_challenge_easy_100_percent

  • Dataset size : 819.65 MiB

  • Auto-cached ( documentation ): No

  • Splits :

Split Examples
'train' 5,000
  • Feature structure :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'height': Tensor(shape=(1,), dtype=tf.float32),
            'orientations': Tensor(shape=(14,), dtype=tf.float32),
            'velocity': Tensor(shape=(9,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Feature documentation :
Feature Class Shape Dtype תיאור
FeaturesDict
episode_return Tensor tf.float32
steps Dataset
steps/action Tensor (6,) tf.float32
steps/discount Tensor (1,) tf.float32
steps/is_first Tensor tf.bool
steps/is_last Tensor tf.bool
steps/is_terminal Tensor tf.bool
steps/observation FeaturesDict
steps/observation/dummy-0 Tensor (1,) tf.float32
steps/observation/dummy-1 Tensor (1,) tf.float32
steps/observation/dummy-2 Tensor (1,) tf.float32
steps/observation/dummy-3 Tensor (1,) tf.float32
steps/observation/dummy-4 Tensor (1,) tf.float32
steps/observation/dummy-5 Tensor (1,) tf.float32
steps/observation/dummy-6 Tensor (1,) tf.float32
steps/observation/dummy-7 Tensor (1,) tf.float32
steps/observation/dummy-8 Tensor (1,) tf.float32
steps/observation/dummy-9 Tensor (1,) tf.float32
steps/observation/height Tensor (1,) tf.float32
steps/observation/orientations Tensor (14,) tf.float32
steps/observation/velocity Tensor (9,) tf.float32
steps/reward Tensor (1,) tf.float32

rlu_rwrl/humanoid_walk_combined_challenge_easy_1_percent

  • Dataset size : 77.11 MiB

  • Auto-cached ( documentation ): Yes

  • Splits :

Split Examples
'train' 200
  • Feature structure :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=tf.float32),
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'extremities': Tensor(shape=(12,), dtype=tf.float32),
            'head_height': Tensor(shape=(1,), dtype=tf.float32),
            'joint_angles': Tensor(shape=(21,), dtype=tf.float32),
            'torso_vertical': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(27,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Feature documentation :
Feature Class Shape Dtype תיאור
FeaturesDict
episode_return Tensor tf.float32
steps Dataset
steps/action Tensor (21,) tf.float32
steps/discount Tensor (1,) tf.float32
steps/is_first Tensor tf.bool
steps/is_last Tensor tf.bool
steps/is_terminal Tensor tf.bool
steps/observation FeaturesDict
steps/observation/com_velocity Tensor (3,) tf.float32
steps/observation/dummy-0 Tensor (1,) tf.float32
steps/observation/dummy-1 Tensor (1,) tf.float32
steps/observation/dummy-2 Tensor (1,) tf.float32
steps/observation/dummy-3 Tensor (1,) tf.float32
steps/observation/dummy-4 Tensor (1,) tf.float32
steps/observation/dummy-5 Tensor (1,) tf.float32
steps/observation/dummy-6 Tensor (1,) tf.float32
steps/observation/dummy-7 Tensor (1,) tf.float32
steps/observation/dummy-8 Tensor (1,) tf.float32
steps/observation/dummy-9 Tensor (1,) tf.float32
steps/observation/extremities Tensor (12,) tf.float32
steps/observation/head_height Tensor (1,) tf.float32
steps/observation/joint_angles Tensor (21,) tf.float32
steps/observation/torso_vertical Tensor (3,) tf.float32
steps/observation/velocity Tensor (27,) tf.float32
steps/reward Tensor (1,) tf.float32

rlu_rwrl/humanoid_walk_combined_challenge_easy_5_percent

  • Dataset size : 385.54 MiB

  • Auto-cached ( documentation ): No

  • Splits :

Split Examples
'train' 1,000
  • Feature structure :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=tf.float32),
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'extremities': Tensor(shape=(12,), dtype=tf.float32),
            'head_height': Tensor(shape=(1,), dtype=tf.float32),
            'joint_angles': Tensor(shape=(21,), dtype=tf.float32),
            'torso_vertical': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(27,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Feature documentation :
Feature Class Shape Dtype תיאור
FeaturesDict
episode_return Tensor tf.float32
steps Dataset
steps/action Tensor (21,) tf.float32
steps/discount Tensor (1,) tf.float32
steps/is_first Tensor tf.bool
steps/is_last Tensor tf.bool
steps/is_terminal Tensor tf.bool
steps/observation FeaturesDict
steps/observation/com_velocity Tensor (3,) tf.float32
steps/observation/dummy-0 Tensor (1,) tf.float32
steps/observation/dummy-1 Tensor (1,) tf.float32
steps/observation/dummy-2 Tensor (1,) tf.float32
steps/observation/dummy-3 Tensor (1,) tf.float32
steps/observation/dummy-4 Tensor (1,) tf.float32
steps/observation/dummy-5 Tensor (1,) tf.float32
steps/observation/dummy-6 Tensor (1,) tf.float32
steps/observation/dummy-7 Tensor (1,) tf.float32
steps/observation/dummy-8 Tensor (1,) tf.float32
steps/observation/dummy-9 Tensor (1,) tf.float32
steps/observation/extremities Tensor (12,) tf.float32
steps/observation/head_height Tensor (1,) tf.float32
steps/observation/joint_angles Tensor (21,) tf.float32
steps/observation/torso_vertical Tensor (3,) tf.float32
steps/observation/velocity Tensor (27,) tf.float32
steps/reward Tensor (1,) tf.float32

rlu_rwrl/humanoid_walk_combined_challenge_easy_20_percent

  • Dataset size : 1.51 GiB

  • Auto-cached ( documentation ): No

  • Splits :

Split Examples
'train' 4,000
  • Feature structure :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=tf.float32),
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'extremities': Tensor(shape=(12,), dtype=tf.float32),
            'head_height': Tensor(shape=(1,), dtype=tf.float32),
            'joint_angles': Tensor(shape=(21,), dtype=tf.float32),
            'torso_vertical': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(27,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Feature documentation :
Feature Class Shape Dtype תיאור
FeaturesDict
episode_return Tensor tf.float32
steps Dataset
steps/action Tensor (21,) tf.float32
steps/discount Tensor (1,) tf.float32
steps/is_first Tensor tf.bool
steps/is_last Tensor tf.bool
steps/is_terminal Tensor tf.bool
steps/observation FeaturesDict
steps/observation/com_velocity Tensor (3,) tf.float32
steps/observation/dummy-0 Tensor (1,) tf.float32
steps/observation/dummy-1 Tensor (1,) tf.float32
steps/observation/dummy-2 Tensor (1,) tf.float32
steps/observation/dummy-3 Tensor (1,) tf.float32
steps/observation/dummy-4 Tensor (1,) tf.float32
steps/observation/dummy-5 Tensor (1,) tf.float32
steps/observation/dummy-6 Tensor (1,) tf.float32
steps/observation/dummy-7 Tensor (1,) tf.float32
steps/observation/dummy-8 Tensor (1,) tf.float32
steps/observation/dummy-9 Tensor (1,) tf.float32
steps/observation/extremities Tensor (12,) tf.float32
steps/observation/head_height Tensor (1,) tf.float32
steps/observation/joint_angles Tensor (21,) tf.float32
steps/observation/torso_vertical Tensor (3,) tf.float32
steps/observation/velocity Tensor (27,) tf.float32
steps/reward Tensor (1,) tf.float32

rlu_rwrl/humanoid_walk_combined_challenge_easy_40_percent

  • Dataset size : 3.01 GiB

  • Auto-cached ( documentation ): No

  • Splits :

Split Examples
'train' 8,000
  • Feature structure :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=tf.float32),
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'extremities': Tensor(shape=(12,), dtype=tf.float32),
            'head_height': Tensor(shape=(1,), dtype=tf.float32),
            'joint_angles': Tensor(shape=(21,), dtype=tf.float32),
            'torso_vertical': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(27,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Feature documentation :
Feature Class Shape Dtype תיאור
FeaturesDict
episode_return Tensor tf.float32
steps Dataset
steps/action Tensor (21,) tf.float32
steps/discount Tensor (1,) tf.float32
steps/is_first Tensor tf.bool
steps/is_last Tensor tf.bool
steps/is_terminal Tensor tf.bool
steps/observation FeaturesDict
steps/observation/com_velocity Tensor (3,) tf.float32
steps/observation/dummy-0 Tensor (1,) tf.float32
steps/observation/dummy-1 Tensor (1,) tf.float32
steps/observation/dummy-2 Tensor (1,) tf.float32
steps/observation/dummy-3 Tensor (1,) tf.float32
steps/observation/dummy-4 Tensor (1,) tf.float32
steps/observation/dummy-5 Tensor (1,) tf.float32
steps/observation/dummy-6 Tensor (1,) tf.float32
steps/observation/dummy-7 Tensor (1,) tf.float32
steps/observation/dummy-8 Tensor (1,) tf.float32
steps/observation/dummy-9 Tensor (1,) tf.float32
steps/observation/extremities Tensor (12,) tf.float32
steps/observation/head_height Tensor (1,) tf.float32
steps/observation/joint_angles Tensor (21,) tf.float32
steps/observation/torso_vertical Tensor (3,) tf.float32
steps/observation/velocity Tensor (27,) tf.float32
steps/reward Tensor (1,) tf.float32

rlu_rwrl/humanoid_walk_combined_challenge_easy_100_percent

  • Dataset size : 7.53 GiB

  • Auto-cached ( documentation ): No

  • Splits :

Split Examples
'train' 20,000
  • Feature structure :
FeaturesDict({
    'episode_return': tf.float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=tf.float32),
        'discount': Tensor(shape=(1,), dtype=tf.float32),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=tf.float32),
            'dummy-0': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-1': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-2': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-3': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-4': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-5': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-6': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-7': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-8': Tensor(shape=(1,), dtype=tf.float32),
            'dummy-9': Tensor(shape=(1,), dtype=tf.float32),
            'extremities': Tensor(shape=(12,), dtype=tf.float32),
            'head_height': Tensor(shape=(1,), dtype=tf.float32),
            'joint_angles': Tensor(shape=(21,), dtype=tf.float32),
            'torso_vertical': Tensor(shape=(3,), dtype=tf.float32),
            'velocity': Tensor(shape=(27,), dtype=tf.float32),
        }),
        'reward': Tensor(shape=(1,), dtype=tf.float32),
    }),
})
  • Feature documentation :
Feature Class Shape Dtype תיאור
FeaturesDict
episode_return Tensor tf.float32
steps Dataset
steps/action Tensor (21,) tf.float32
steps/discount Tensor (1,) tf.float32
steps/is_first Tensor tf.bool
steps/is_last Tensor tf.bool
steps/is_terminal Tensor tf.bool
steps/observation FeaturesDict
steps/observation/com_velocity Tensor (3,) tf.float32
steps/observation/dummy-0 Tensor (1,) tf.float32
steps/observation/dummy-1 Tensor (1,) tf.float32
steps/observation/dummy-2 Tensor (1,) tf.float32
steps/observation/dummy-3 Tensor (1,) tf.float32
steps/observation/dummy-4 Tensor (1,) tf.float32
steps/observation/dummy-5 Tensor (1,) tf.float32
steps/observation/dummy-6 Tensor (1,) tf.float32
steps/observation/dummy-7 Tensor (1,) tf.float32
steps/observation/dummy-8 Tensor (1,) tf.float32
steps/observation/dummy-9 Tensor (1,) tf.float32
steps/observation/extremities Tensor (12,) tf.float32
steps/observation/head_height Tensor (1,) tf.float32
steps/observation/joint_angles Tensor (21,) tf.float32
steps/observation/torso_vertical Tensor (3,) tf.float32
steps/observation/velocity Tensor (27,) tf.float32
steps/reward Tensor (1,) tf.float32