asu_table_top_converted_externally_to_rlds

  • 설명 :

탁상용 선택/배치/회전 작업을 수행하는 UR5

나뉘다
'train' 110
  • 기능 구조 :
FeaturesDict({
    'episode_metadata': FeaturesDict({
        'file_path': Text(shape=(), dtype=string),
    }),
    'steps': Dataset({
        'action': Tensor(shape=(7,), dtype=float32),
        'action_delta': Tensor(shape=(7,), dtype=float32),
        'action_inst': Text(shape=(), dtype=string),
        'discount': Scalar(shape=(), dtype=float32),
        'goal_object': Text(shape=(), dtype=string),
        'ground_truth_states': FeaturesDict({
            'EE': Tensor(shape=(6,), dtype=float32),
            'bottle': Tensor(shape=(6,), dtype=float32),
            'bread': Tensor(shape=(6,), dtype=float32),
            'coke': Tensor(shape=(6,), dtype=float32),
            'cube': Tensor(shape=(6,), dtype=float32),
            'milk': Tensor(shape=(6,), dtype=float32),
            'pepsi': Tensor(shape=(6,), dtype=float32),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'language_embedding': Tensor(shape=(512,), dtype=float32),
        'language_instruction': Text(shape=(), dtype=string),
        'observation': FeaturesDict({
            'image': Image(shape=(224, 224, 3), dtype=uint8),
            'state': Tensor(shape=(7,), dtype=float32),
            'state_vel': Tensor(shape=(7,), dtype=float32),
        }),
        'reward': Scalar(shape=(), dtype=float32),
    }),
})
  • 기능 문서 :
특징 수업 모양 Dtype 설명
특징Dict
에피소드_메타데이터 특징Dict
에피소드_메타데이터/파일_경로 텍스트 원본 데이터 파일의 경로입니다.
단계 데이터세트
단계/작업 텐서 (7,) float32 로봇 액션은 [7x 관절 속도, 2x 그리퍼 속도, 1x 종료 에피소드]로 구성됩니다.
단계/action_delta 텐서 (7,) float32 로봇 델타 액션은 [7x 관절 속도, 2x 그리퍼 속도, 1x 종료 에피소드]로 구성됩니다.
단계/action_inst 텍스트 수행할 작업입니다.
걸음수/할인 스칼라 float32 할인이 제공되면 기본값은 1입니다.
걸음 수/goal_object 텍스트 조작할 개체입니다.
단계/ground_truth_states 특징Dict
단계/ground_truth_states/EE 텐서 (6,) float32 xyzrpy
단계/ground_truth_states/병 텐서 (6,) float32 xyzrpy
단계/ground_truth_states/빵 텐서 (6,) float32 xyzrpy
단계/ground_truth_states/콜라 텐서 (6,) float32 xyzrpy
단계/ground_truth_states/큐브 텐서 (6,) float32 xyzrpy
단계/ground_truth_states/우유 텐서 (6,) float32 xyzrpy
단계/ground_truth_states/펩시 텐서 (6,) float32 xyzrpy
걸음수/is_first 텐서 부울
걸음수/is_last 텐서 부울
단계/is_terminal 텐서 부울
단계/언어_임베딩 텐서 (512,) float32 코나 언어 임베딩. https://tfhub.dev/google/universal-sentence-encoder-large/5를 참조하세요.
단계/언어_지시 텍스트 언어 교육.
단계/관찰 특징Dict
단계/관찰/이미지 영상 (224, 224, 3) uint8 메인 카메라 RGB 관찰.
단계/관찰/상태 텐서 (7,) float32 로봇 상태는 [6x 로봇 관절 각도, 1x 그리퍼 위치]로 구성됩니다.
단계/관찰/state_vel 텐서 (7,) float32 로봇 관절 속도는 [6x 로봇 관절 각도, 1x 그리퍼 위치]로 구성됩니다.
걸음수/보상 스칼라 float32 제공되는 경우 보상, 데모의 마지막 단계에서 1개.
  • 인용 :
@inproceedings{zhou2023modularity,
  title={Modularity through Attention: Efficient Training and Transfer of Language-Conditioned Policies for Robot Manipulation},
  author={Zhou, Yifan and Sonawani, Shubham and Phielipp, Mariano and Stepputtis, Simon and Amor, Heni},
  booktitle={Conference on Robot Learning},
  pages={1684--1695},
  year={2023},
  organization={PMLR}
}
@article{zhou2023learning,
  title={Learning modular language-conditioned robot policies through attention},
  author={Zhou, Yifan and Sonawani, Shubham and Phielipp, Mariano and Ben Amor, Heni and Stepputtis, Simon},
  journal={Autonomous Robots},
  pages={1--21},
  year={2023},
  publisher={Springer}
}