asu_table_top_converted_externally_to_rlds

  • คำอธิบาย :

UR5 ปฏิบัติงานหยิบ/วาง/หมุนบนโต๊ะ

แยก ตัวอย่าง
'train' 110
  • โครงสร้างคุณสมบัติ :
FeaturesDict({
    'episode_metadata': FeaturesDict({
        'file_path': Text(shape=(), dtype=string),
    }),
    'steps': Dataset({
        'action': Tensor(shape=(7,), dtype=float32),
        'action_delta': Tensor(shape=(7,), dtype=float32),
        'action_inst': Text(shape=(), dtype=string),
        'discount': Scalar(shape=(), dtype=float32),
        'goal_object': Text(shape=(), dtype=string),
        'ground_truth_states': FeaturesDict({
            'EE': Tensor(shape=(6,), dtype=float32),
            'bottle': Tensor(shape=(6,), dtype=float32),
            'bread': Tensor(shape=(6,), dtype=float32),
            'coke': Tensor(shape=(6,), dtype=float32),
            'cube': Tensor(shape=(6,), dtype=float32),
            'milk': Tensor(shape=(6,), dtype=float32),
            'pepsi': Tensor(shape=(6,), dtype=float32),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'language_embedding': Tensor(shape=(512,), dtype=float32),
        'language_instruction': Text(shape=(), dtype=string),
        'observation': FeaturesDict({
            'image': Image(shape=(224, 224, 3), dtype=uint8),
            'state': Tensor(shape=(7,), dtype=float32),
            'state_vel': Tensor(shape=(7,), dtype=float32),
        }),
        'reward': Scalar(shape=(), dtype=float32),
    }),
})
  • เอกสารคุณสมบัติ :
คุณสมบัติ ระดับ รูปร่าง ประเภทD คำอธิบาย
คุณสมบัติDict
ตอนที่_ข้อมูลเมตา คุณสมบัติDict
ตอนที่_metadata/file_path ข้อความ เชือก เส้นทางไปยังไฟล์ข้อมูลต้นฉบับ
ขั้นตอน ชุดข้อมูล
ขั้นตอน/การดำเนินการ เทนเซอร์ (7,) ลอย32 การทำงานของหุ่นยนต์ประกอบด้วย [ความเร็วข้อต่อ 7x, ความเร็วของกริปเปอร์ 2x, ตอนสิ้นสุด 1x]
ขั้นตอน/action_delta เทนเซอร์ (7,) ลอย32 การกระทำของหุ่นยนต์เดลต้าประกอบด้วย [ความเร็วข้อต่อ 7x, ความเร็วของกริปเปอร์ 2x, ตอนสิ้นสุด 1x]
ขั้นตอน/การกระทำ_inst ข้อความ เชือก การดำเนินการที่จะดำเนินการ
ขั้นตอน/ส่วนลด สเกลาร์ ลอย32 ส่วนลดหากมีให้ ค่าเริ่มต้นคือ 1
ขั้นตอน/เป้าหมาย_วัตถุ ข้อความ เชือก วัตถุที่จะจัดการด้วย
ขั้นตอน/ground_truth_states คุณสมบัติDict
ขั้นตอน/ground_truth_states/EE เทนเซอร์ (6,) ลอย32 xyzrpy
ขั้นตอน/ground_truth_states/ขวด เทนเซอร์ (6,) ลอย32 xyzrpy
ขั้นตอน/ground_truth_states/bread เทนเซอร์ (6,) ลอย32 xyzrpy
ขั้นตอน/ground_truth_states/โค้ก เทนเซอร์ (6,) ลอย32 xyzrpy
ขั้นตอน/ground_truth_states/cube เทนเซอร์ (6,) ลอย32 xyzrpy
ขั้นตอน/ground_truth_states/นม เทนเซอร์ (6,) ลอย32 xyzrpy
ขั้นตอน/ground_truth_states/pepsi เทนเซอร์ (6,) ลอย32 xyzrpy
ขั้นตอน/is_first เทนเซอร์ บูล
ขั้นตอน/is_last เทนเซอร์ บูล
ขั้นตอน/is_terminal เทนเซอร์ บูล
ขั้นตอน/ภาษา_embedding เทนเซอร์ (512,) ลอย32 การฝังภาษาโคน่า ดู https://tfhub.dev/google/universal-sentence-encoder-large/5
ขั้นตอน/Language_instruction ข้อความ เชือก การสอนภาษา.
ขั้นตอน/การสังเกต คุณสมบัติDict
ขั้นตอน/การสังเกต/ภาพ ภาพ (224, 224, 3) uint8 การสังเกต RGB ของกล้องหลัก
ขั้นตอน/การสังเกต/สถานะ เทนเซอร์ (7,) ลอย32 สถานะของหุ่นยนต์ประกอบด้วย [6x มุมข้อต่อของหุ่นยนต์, 1x ตำแหน่งกริปเปอร์]
ขั้นตอน/การสังเกต/state_vel เทนเซอร์ (7,) ลอย32 ความเร็วข้อต่อของหุ่นยนต์ประกอบด้วย [6x มุมข้อต่อของหุ่นยนต์, 1x ตำแหน่งกริปเปอร์]
ขั้นตอน/รางวัล สเกลาร์ ลอย32 รางวัลหากมีให้ 1 ในขั้นตอนสุดท้ายสำหรับการสาธิต
  • การอ้างอิง :
@inproceedings{zhou2023modularity,
  title={Modularity through Attention: Efficient Training and Transfer of Language-Conditioned Policies for Robot Manipulation},
  author={Zhou, Yifan and Sonawani, Shubham and Phielipp, Mariano and Stepputtis, Simon and Amor, Heni},
  booktitle={Conference on Robot Learning},
  pages={1684--1695},
  year={2023},
  organization={PMLR}
}
@article{zhou2023learning,
  title={Learning modular language-conditioned robot policies through attention},
  author={Zhou, Yifan and Sonawani, Shubham and Phielipp, Mariano and Ben Amor, Heni and Stepputtis, Simon},
  journal={Autonomous Robots},
  pages={1--21},
  year={2023},
  publisher={Springer}
}