ویولا

  • شرح :

ربات فرانکا در حال تعامل با وظایف آشپزخانه است

شکاف مثال ها
'test' 15
'train' 135
  • ساختار ویژگی :
FeaturesDict({
    'steps': Dataset({
        'action': FeaturesDict({
            'gripper_closedness_action': float32,
            'rotation_delta': Tensor(shape=(3,), dtype=float32),
            'terminate_episode': float32,
            'world_vector': Tensor(shape=(3,), dtype=float32),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'agentview_rgb': Image(shape=(224, 224, 3), dtype=uint8),
            'ee_states': Tensor(shape=(16,), dtype=float32),
            'eye_in_hand_rgb': Image(shape=(224, 224, 3), dtype=uint8),
            'gripper_states': Tensor(shape=(1,), dtype=float32),
            'joint_states': Tensor(shape=(7,), dtype=float32),
            'natural_language_embedding': Tensor(shape=(512,), dtype=float32),
            'natural_language_instruction': string,
        }),
        'reward': Scalar(shape=(), dtype=float32),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
مراحل مجموعه داده
مراحل/عمل FeaturesDict
steps/action/gripper_closedness_action تانسور float32
Steps/Action/rotation_delta تانسور (3،) float32
مراحل/عمل/پایان_اپیزود تانسور float32
Steps/Action/world_vector تانسور (3،) float32
Steps/is_first تانسور بوول
Steps/is_last تانسور بوول
Steps/is_terminal تانسور بوول
مراحل / مشاهده FeaturesDict
Steps/observation/agentview_rgb تصویر (224، 224، 3) uint8 RGB توسط دوربین فضای کاری گرفته شده است
steps/observation/ee_states تانسور (16،) float32 موقعیت عامل انتهایی که به عنوان یک ماتریس همگن مشخص شده است.
steps/observation/eye_in_hand_rgb تصویر (224، 224، 3) uint8 RGB با دوربین دستی گرفته شده است
steps/observation/gripper_states تانسور (1،) float32 gripper_states = 0 به این معنی است که گیره کاملاً بسته است. این مقدار نشان دهنده عرض گریپر Franka Panda Gripper است.
steps/observation/joint_states تانسور (7،) float32 ارزش های مشترک
steps/observation/natural_language_embedding تانسور (512،) float32
مراحل/مشاهده/آموزش_زبان_طبیعی تانسور رشته
مراحل/پاداش اسکالر float32
@article{zhu2022viola,
  title={VIOLA: Imitation Learning for Vision-Based Manipulation with Object Proposal Priors},
  author={Zhu, Yifeng and Joshi, Abhishek and Stone, Peter and Zhu, Yuke},
  journal={6th Annual Conference on Robot Learning (CoRL)},
  year={2022}
}