mt_opt

  • תיאור :

מערכי נתונים עבור נייר MT-Opt .

@misc{kalashnikov2021mtopt,
      title={MT-Opt: Continuous Multi-Task Robotic Reinforcement Learning at Scale},
      author={Dmitry Kalashnikov and Jacob Varley and Yevgen Chebotar and Benjamin Swanson and Rico Jonschkowski and Chelsea Finn and Sergey Levine and Karol Hausman},
      year={2021},
      eprint={2104.08212},
      archivePrefix={arXiv},
      primaryClass={cs.RO}
}

mt_opt/rlds (תצורת ברירת המחדל)

  • תיאור תצורה : מערך נתונים זה מכיל פרקי משימות שנאספו על פני שפע רובוטים אמיתיים. זה עוקב אחר פורמט RLDS כדי לייצג שלבים ופרקים.

  • גודל מערך נתונים : 4.38 TiB

  • פיצולים :

לְפַצֵל דוגמאות
'train' 920,165
  • מבנה תכונה :
FeaturesDict({
    'episode_id': tf.string,
    'skill': tf.uint8,
    'steps': Dataset({
        'action': FeaturesDict({
            'close_gripper': tf.bool,
            'open_gripper': tf.bool,
            'target_pose': Tensor(shape=(7,), dtype=tf.float32),
            'terminate': tf.bool,
        }),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': FeaturesDict({
            'gripper_closed': tf.bool,
            'height_to_bottom': tf.float32,
            'image': Image(shape=(512, 640, 3), dtype=tf.uint8),
            'state_dense': Tensor(shape=(7,), dtype=tf.float32),
        }),
    }),
    'task_code': tf.string,
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
פרק_מזהה מוֹתֵחַ tf.string
מְיוּמָנוּת מוֹתֵחַ tf.uint8
צעדים מערך נתונים
צעדים/פעולה FeaturesDict
steps/action/close_gripper מוֹתֵחַ tf.bool
steps/action/open_gripper מוֹתֵחַ tf.bool
steps/action/target_pose מוֹתֵחַ (7,) tf.float32
שלבים/פעולה/סיום מוֹתֵחַ tf.bool
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית FeaturesDict
מדרגות/תצפית/גריפר_סגור מוֹתֵחַ tf.bool
צעדים/תצפית/גובה_למטה מוֹתֵחַ tf.float32
צעדים/תצפית/תמונה תמונה (512, 640, 3) tf.uint8
צעדים/תצפית/מצב_צפוף מוֹתֵחַ (7,) tf.float32
קוד_משימה מוֹתֵחַ tf.string

mt_opt/sd

  • תיאור תצורה : מערך הנתונים של גלאי ההצלחה המכיל הגדרות שנאספו על ידי אנושיות של השלמת משימות.

  • גודל מערך נתונים : 548.56 GiB

  • פיצולים :

לְפַצֵל דוגמאות
'test' 94,636
'train' 380,234
  • מבנה תכונה :
FeaturesDict({
    'image_0': Image(shape=(512, 640, 3), dtype=tf.uint8),
    'image_1': Image(shape=(480, 640, 3), dtype=tf.uint8),
    'image_2': Image(shape=(480, 640, 3), dtype=tf.uint8),
    'success': tf.bool,
    'task_code': tf.string,
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
תמונה_0 תמונה (512, 640, 3) tf.uint8
תמונה_1 תמונה (480, 640, 3) tf.uint8
תמונה_2 תמונה (480, 640, 3) tf.uint8
הַצלָחָה מוֹתֵחַ tf.bool
קוד_משימה מוֹתֵחַ tf.string