mt_opt

  • คำอธิบาย :

ชุดข้อมูลสำหรับ กระดาษ MT-Opt

@misc{kalashnikov2021mtopt,
      title={MT-Opt: Continuous Multi-Task Robotic Reinforcement Learning at Scale},
      author={Dmitry Kalashnikov and Jacob Varley and Yevgen Chebotar and Benjamin Swanson and Rico Jonschkowski and Chelsea Finn and Sergey Levine and Karol Hausman},
      year={2021},
      eprint={2104.08212},
      archivePrefix={arXiv},
      primaryClass={cs.RO}
}

mt_opt/rlds (การกำหนดค่าเริ่มต้น)

  • คำอธิบาย การกำหนดค่า : ชุดข้อมูลนี้มีตอนของงานที่รวบรวมจากกลุ่มหุ่นยนต์จริง เป็นไปตาม รูปแบบ RLDS เพื่อแสดงถึงขั้นตอนและตอนต่างๆ

  • ขนาดชุดข้อมูล : 4.38 TiB

  • แยก :

แยก ตัวอย่าง
'train' 920,165
  • โครงสร้างคุณลักษณะ :
FeaturesDict({
    'episode_id': string,
    'skill': uint8,
    'steps': Dataset({
        'action': FeaturesDict({
            'close_gripper': bool,
            'open_gripper': bool,
            'target_pose': Tensor(shape=(7,), dtype=float32),
            'terminate': bool,
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'gripper_closed': bool,
            'height_to_bottom': float32,
            'image': Image(shape=(512, 640, 3), dtype=uint8),
            'state_dense': Tensor(shape=(7,), dtype=float32),
        }),
    }),
    'task_code': string,
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
ตอนที่_id เทนเซอร์ สตริง
ทักษะ เทนเซอร์ uint8
ขั้นตอน ชุดข้อมูล
ขั้นตอน/การดำเนินการ คุณสมบัติDict
ขั้นตอน/การกระทำ/close_gripper เทนเซอร์ บูล
ขั้นตอน/การกระทำ/open_gripper เทนเซอร์ บูล
ขั้นตอน/การกระทำ/target_pose เทนเซอร์ (7,) ลอย32
ขั้นตอน/การดำเนินการ/ยุติ เทนเซอร์ บูล
ขั้นตอน/is_first เทนเซอร์ บูล
ขั้นตอน/is_last เทนเซอร์ บูล
ขั้นตอน/is_terminal เทนเซอร์ บูล
ขั้นตอน/ข้อสังเกต คุณสมบัติDict
ขั้นตอน/การสังเกต/gripper_closed เทนเซอร์ บูล
ขั้นตอน/การสังเกต/height_to_bottom เทนเซอร์ ลอย32
ขั้นตอน/ข้อสังเกต/ภาพ ภาพ (512, 640, 3) uint8
ขั้นตอน/การสังเกต/state_dense เทนเซอร์ (7,) ลอย32
task_code เทนเซอร์ สตริง

mt_opt/sd

  • คำอธิบาย การกำหนดค่า : ชุดข้อมูลตัวตรวจจับความสำเร็จที่มีคำจำกัดความของงานที่เสร็จสิ้นโดยมนุษย์

  • ขนาดชุดข้อมูล : 548.56 GiB

  • แยก :

แยก ตัวอย่าง
'test' 94,636
'train' 380,234
  • โครงสร้างคุณลักษณะ :
FeaturesDict({
    'image_0': Image(shape=(512, 640, 3), dtype=uint8),
    'image_1': Image(shape=(480, 640, 3), dtype=uint8),
    'image_2': Image(shape=(480, 640, 3), dtype=uint8),
    'success': bool,
    'task_code': string,
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
รูปภาพ_0 ภาพ (512, 640, 3) uint8
รูปภาพ_1 ภาพ (480, 640, 3) uint8
อิมเมจ_2 ภาพ (480, 640, 3) uint8
ความสำเร็จ เทนเซอร์ บูล
task_code เทนเซอร์ สตริง