columbia_cairlab_pusht_real

  • 説明

UR5 平面プッシュ タスク

スプリット
'test' 14
'train' 122
  • 機能の構造:
FeaturesDict({
    'steps': Dataset({
        'action': FeaturesDict({
            'gripper_closedness_action': float32,
            'rotation_delta': Tensor(shape=(3,), dtype=float32),
            'terminate_episode': float32,
            'world_vector': Tensor(shape=(3,), dtype=float32),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'image': Image(shape=(240, 320, 3), dtype=uint8),
            'natural_language_embedding': Tensor(shape=(512,), dtype=float32),
            'natural_language_instruction': string,
            'robot_state': Tensor(shape=(2,), dtype=float32),
            'wrist_image': Image(shape=(240, 320, 3), dtype=uint8),
        }),
        'reward': Scalar(shape=(), dtype=float32),
    }),
})
  • 機能ドキュメント:
特徴クラスDタイプ説明
特徴辞書
ステップデータセット
ステップ/アクション特徴辞書
ステップ/アクション/gripper_closedness_actionテンソルfloat32グリッパーが閉じている場合は 1、グリッパーが開いている場合は -1、変化がない場合は 0。
ステップ/アクション/回転デルタテンソル(3,) float32ロール、ピッチ、ヨーのデルタ変化。
ステップ/アクション/terminate_episodeテンソルfloat32
ステップ/アクション/world_vectorテンソル(3,) float32 XYZ のデルタ変化。
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
手順・観察・イメージ画像(240、320、3) uint8
ステップ/観察/natural_lang_embeddingテンソル(512,) float32
ステップ/観察/natural_ language_instructionテンソル
ステップ/観察/ロボット状態テンソル(2,) float32ロボットエンドエフェクタのXY状態
歩数/観察/手首画像画像(240、320、3) uint8
歩数/報酬スカラーfloat32
  • 引用
@inproceedings{chi2023diffusionpolicy,
    title={Diffusion Policy: Visuomotor Policy Learning via Action Diffusion},
    author={Chi, Cheng and Feng, Siyuan and Du, Yilun and Xu, Zhenjia and Cousineau, Eric and Burchfiel, Benjamin and Song, Shuran},
    booktitle={Proceedings of Robotics: Science and Systems (RSS)},
    year={2023}
}