austin_sailor_dataset_converted_externally_to_rlds

  • Sự miêu tả :

Nhiệm vụ sắp xếp bảng của Franka

Tách ra Ví dụ
'train' 240
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_metadata': FeaturesDict({
        'file_path': Text(shape=(), dtype=string),
    }),
    'steps': Dataset({
        'action': Tensor(shape=(7,), dtype=float32),
        'discount': Scalar(shape=(), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'language_embedding': Tensor(shape=(512,), dtype=float32),
        'language_instruction': Text(shape=(), dtype=string),
        'observation': FeaturesDict({
            'image': Image(shape=(128, 128, 3), dtype=uint8),
            'state': Tensor(shape=(8,), dtype=float32),
            'state_ee': Tensor(shape=(16,), dtype=float32),
            'state_gripper': Tensor(shape=(1,), dtype=float32),
            'state_joint': Tensor(shape=(7,), dtype=float32),
            'wrist_image': Image(shape=(128, 128, 3), dtype=uint8),
        }),
        'reward': Scalar(shape=(), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp học Hình dạng loại D Sự miêu tả
Tính năngDict
tập_siêu dữ liệu Tính năngDict
tập_siêu dữ liệu/file_path Chữ sợi dây Đường dẫn tới file dữ liệu gốc.
bước Tập dữ liệu
bước/hành động Tenxơ (7,) phao32 Hành động của robot, bao gồm [3x ee vị trí tương đối, 3x ee xoay tương đối, 1x hành động kẹp].
bước/giảm giá Vô hướng phao32 Giảm giá nếu được cung cấp, mặc định là 1.
bước/is_first Tenxơ bool
bước/is_last Tenxơ bool
bước/is_terminal Tenxơ bool
các bước/ngôn ngữ_embedding Tenxơ (512,) phao32 Nhúng ngôn ngữ Kona. Xem https://tfhub.dev/google/universal-sentence-encoding-large/5
các bước/ngôn ngữ_instruction Chữ sợi dây Giảng dạy ngôn ngữ.
bước/quan sát Tính năngDict
bước/quan sát/hình ảnh Hình ảnh (128, 128, 3) uint8 Quan sát RGB của camera chính.
bước/quan sát/trạng thái Tenxơ (số 8,) phao32 Trạng thái robot mặc định, bao gồm [3x robot ee pos, 3x ee quat, 1x trạng thái kẹp].
bước/quan sát/state_ee Tenxơ (16,) phao32 Trạng thái tác động cuối, được biểu diễn dưới dạng ma trận biến đổi đồng nhất 4x4 của tư thế ee.
bước/quan sát/state_gripper Tenxơ (1,) phao32 Chiều rộng mở của kẹp robot. Phạm vi từ ~0 (đóng) đến ~0,077 (mở)
bước/quan sát/state_joint Tenxơ (7,) phao32 Thông tin về khớp 7-dof của robot (không được sử dụng trong bộ dữ liệu SAILOR gốc).
bước/quan sát/hình ảnh cổ tay Hình ảnh (128, 128, 3) uint8 Camera đeo tay quan sát RGB.
bước/phần thưởng Vô hướng phao32 Đúng ở bước cuối cùng của tập phim.
  • Trích dẫn :
@inproceedings{nasiriany2022sailor,
      title={Learning and Retrieval from Prior Data for Skill-based Imitation Learning},
      author={Soroush Nasiriany and Tian Gao and Ajay Mandlekar and Yuke Zhu},
      booktitle={Conference on Robot Learning (CoRL)},
      year={2022}
    }