ロボミミック_mg

  • 説明:

Robomimic マシンで生成されたデータセットは、密な報酬でトレーニングされた Soft Actor Critic エージェントを使用して収集されました。各データセットは、エージェントのリプレイ バッファで構成されます。

各タスクには 2 つのバージョンがあります。1 つは低次元観測 ( low_dim ) で、もう 1 つは画像 ( image ) です。

データセットはRLDS 形式に従って、ステップとエピソードを表します。

@inproceedings{robomimic2021,
  title={What Matters in Learning from Offline Human Demonstrations for Robot Manipulation},
  author={Ajay Mandlekar and Danfei Xu and Josiah Wong and Soroush Nasiriany
          and Chen Wang and Rohun Kulkarni and Li Fei-Fei and Silvio Savarese
          and Yuke Zhu and Roberto Mart\'{i}n-Mart\'{i}n},
  booktitle={Conference on Robot Learning},
  year={2021}
}

robomimic_mg/lift_mg_image (デフォルト設定)

  • ダウンロードサイズ: 18.04 GiB

  • データセットサイズ: 2.73 GiB

  • 自動キャッシュ(ドキュメント): いいえ

  • スプリット:

スプリット
'train' 1,500
  • 機能構造:
FeaturesDict({
    'episode_id': string,
    'horizon': int32,
    'steps': Dataset({
        'action': Tensor(shape=(7,), dtype=float64),
        'discount': int32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'agentview_image': Image(shape=(84, 84, 3), dtype=uint8),
            'object': Tensor(shape=(10,), dtype=float64),
            'robot0_eef_pos': Tensor(shape=(3,), dtype=float64),
            'robot0_eef_quat': Tensor(shape=(4,), dtype=float64),
            'robot0_eef_vel_ang': Tensor(shape=(3,), dtype=float64),
            'robot0_eef_vel_lin': Tensor(shape=(3,), dtype=float64),
            'robot0_eye_in_hand_image': Image(shape=(84, 84, 3), dtype=uint8),
            'robot0_gripper_qpos': Tensor(shape=(2,), dtype=float64),
            'robot0_gripper_qvel': Tensor(shape=(2,), dtype=float64),
            'robot0_joint_pos': Tensor(shape=(7,), dtype=float64),
            'robot0_joint_pos_cos': Tensor(shape=(7,), dtype=float64),
            'robot0_joint_pos_sin': Tensor(shape=(7,), dtype=float64),
            'robot0_joint_vel': Tensor(shape=(7,), dtype=float64),
        }),
        'reward': float64,
        'states': Tensor(shape=(32,), dtype=float64),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_idテンソル
地平線テンソルint32
ステップデータセット
ステップ/アクションテンソル(7、) float64
ステップ/割引テンソルint32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観察/agentview_image画像(84、84、3) uint8
ステップ/観察/オブジェクトテンソル(10) float64
ステップ/観察/robot0_eef_posテンソル(3) float64エンドエフェクタの位置
ステップ/観察/robot0_eef_quatテンソル(4) float64エンドエフェクタの向き
ステップ/観察/robot0_eef_vel_angテンソル(3) float64エンドエフェクタ角速度
ステップ/観察/robot0_eef_vel_linテンソル(3) float64エンドエフェクタ直交速度
steps/observation/robot0_eye_in_hand_image画像(84、84、3) uint8
ステップ/観察/robot0_gripper_qposテンソル(2) float64グリッパー位置
ステップ/観察/robot0_gripper_qvelテンソル(2) float64グリッパ速度
steps/observation/robot0_joint_posテンソル(7、) float64 7自由度の関節位置
ステップ/観測/robot0_joint_pos_cosテンソル(7、) float64
ステップ/観測/robot0_joint_pos_sinテンソル(7、) float64
steps/observation/robot0_joint_velテンソル(7、) float64 7自由度の関節速度
ステップ/報酬テンソルfloat64
ステップ/状態テンソル(32) float64

ロボミミック_mg/リフト_mg_low_dim

  • ダウンロードサイズ: 302.25 MiB

  • データセットのサイズ: 195.10 MiB

  • 自動キャッシュ(ドキュメント): shuffle_files=Falseの場合のみ (トレーニング)

  • スプリット:

スプリット
'train' 1,500
  • 機能構造:
FeaturesDict({
    'episode_id': string,
    'horizon': int32,
    'steps': Dataset({
        'action': Tensor(shape=(7,), dtype=float64),
        'discount': int32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'object': Tensor(shape=(10,), dtype=float64),
            'robot0_eef_pos': Tensor(shape=(3,), dtype=float64),
            'robot0_eef_quat': Tensor(shape=(4,), dtype=float64),
            'robot0_eef_vel_ang': Tensor(shape=(3,), dtype=float64),
            'robot0_eef_vel_lin': Tensor(shape=(3,), dtype=float64),
            'robot0_gripper_qpos': Tensor(shape=(2,), dtype=float64),
            'robot0_gripper_qvel': Tensor(shape=(2,), dtype=float64),
            'robot0_joint_pos': Tensor(shape=(7,), dtype=float64),
            'robot0_joint_pos_cos': Tensor(shape=(7,), dtype=float64),
            'robot0_joint_pos_sin': Tensor(shape=(7,), dtype=float64),
            'robot0_joint_vel': Tensor(shape=(7,), dtype=float64),
        }),
        'reward': float64,
        'states': Tensor(shape=(32,), dtype=float64),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_idテンソル
地平線テンソルint32
ステップデータセット
ステップ/アクションテンソル(7、) float64
ステップ/割引テンソルint32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観察/オブジェクトテンソル(10) float64
ステップ/観察/robot0_eef_posテンソル(3) float64エンドエフェクタの位置
ステップ/観察/robot0_eef_quatテンソル(4) float64エンドエフェクタの向き
ステップ/観察/robot0_eef_vel_angテンソル(3) float64エンドエフェクタ角速度
ステップ/観察/robot0_eef_vel_linテンソル(3) float64エンドエフェクタ直交速度
ステップ/観察/robot0_gripper_qposテンソル(2) float64グリッパー位置
ステップ/観察/robot0_gripper_qvelテンソル(2) float64グリッパ速度
steps/observation/robot0_joint_posテンソル(7、) float64 7自由度の関節位置
ステップ/観測/robot0_joint_pos_cosテンソル(7、) float64
ステップ/観測/robot0_joint_pos_sinテンソル(7、) float64
steps/observation/robot0_joint_velテンソル(7、) float64 7自由度の関節速度
ステップ/報酬テンソルfloat64
ステップ/状態テンソル(32) float64

ロボミミック_mg/can_mg_image

  • ダウンロードサイズ: 47.14 GiB

  • データセットサイズ: 11.15 GiB

  • 自動キャッシュ(ドキュメント): いいえ

  • スプリット:

スプリット
'train' 3,900
  • 機能構造:
FeaturesDict({
    'episode_id': string,
    'horizon': int32,
    'steps': Dataset({
        'action': Tensor(shape=(7,), dtype=float64),
        'discount': int32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'agentview_image': Image(shape=(84, 84, 3), dtype=uint8),
            'object': Tensor(shape=(14,), dtype=float64),
            'robot0_eef_pos': Tensor(shape=(3,), dtype=float64),
            'robot0_eef_quat': Tensor(shape=(4,), dtype=float64),
            'robot0_eef_vel_ang': Tensor(shape=(3,), dtype=float64),
            'robot0_eef_vel_lin': Tensor(shape=(3,), dtype=float64),
            'robot0_eye_in_hand_image': Image(shape=(84, 84, 3), dtype=uint8),
            'robot0_gripper_qpos': Tensor(shape=(2,), dtype=float64),
            'robot0_gripper_qvel': Tensor(shape=(2,), dtype=float64),
            'robot0_joint_pos': Tensor(shape=(7,), dtype=float64),
            'robot0_joint_pos_cos': Tensor(shape=(7,), dtype=float64),
            'robot0_joint_pos_sin': Tensor(shape=(7,), dtype=float64),
            'robot0_joint_vel': Tensor(shape=(7,), dtype=float64),
        }),
        'reward': float64,
        'states': Tensor(shape=(71,), dtype=float64),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_idテンソル
地平線テンソルint32
ステップデータセット
ステップ/アクションテンソル(7、) float64
ステップ/割引テンソルint32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観察/agentview_image画像(84、84、3) uint8
ステップ/観察/オブジェクトテンソル(14) float64
ステップ/観察/robot0_eef_posテンソル(3) float64エンドエフェクタの位置
ステップ/観察/robot0_eef_quatテンソル(4) float64エンドエフェクタの向き
ステップ/観察/robot0_eef_vel_angテンソル(3) float64エンドエフェクタ角速度
ステップ/観察/robot0_eef_vel_linテンソル(3) float64エンドエフェクタ直交速度
steps/observation/robot0_eye_in_hand_image画像(84、84、3) uint8
ステップ/観察/robot0_gripper_qposテンソル(2) float64グリッパー位置
ステップ/観察/robot0_gripper_qvelテンソル(2) float64グリッパ速度
steps/observation/robot0_joint_posテンソル(7、) float64 7自由度の関節位置
ステップ/観測/robot0_joint_pos_cosテンソル(7、) float64
ステップ/観測/robot0_joint_pos_sinテンソル(7、) float64
steps/observation/robot0_joint_velテンソル(7、) float64 7自由度の関節速度
ステップ/報酬テンソルfloat64
ステップ/状態テンソル(71) float64

ロボミミック_mg/can_mg_low_dim

  • ダウンロードサイズ: 1.01 GiB

  • データセットのサイズ: 697.71 MiB

  • 自動キャッシュ(ドキュメント): いいえ

  • スプリット:

スプリット
'train' 3,900
  • 機能構造:
FeaturesDict({
    'episode_id': string,
    'horizon': int32,
    'steps': Dataset({
        'action': Tensor(shape=(7,), dtype=float64),
        'discount': int32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'object': Tensor(shape=(14,), dtype=float64),
            'robot0_eef_pos': Tensor(shape=(3,), dtype=float64),
            'robot0_eef_quat': Tensor(shape=(4,), dtype=float64),
            'robot0_eef_vel_ang': Tensor(shape=(3,), dtype=float64),
            'robot0_eef_vel_lin': Tensor(shape=(3,), dtype=float64),
            'robot0_gripper_qpos': Tensor(shape=(2,), dtype=float64),
            'robot0_gripper_qvel': Tensor(shape=(2,), dtype=float64),
            'robot0_joint_pos': Tensor(shape=(7,), dtype=float64),
            'robot0_joint_pos_cos': Tensor(shape=(7,), dtype=float64),
            'robot0_joint_pos_sin': Tensor(shape=(7,), dtype=float64),
            'robot0_joint_vel': Tensor(shape=(7,), dtype=float64),
        }),
        'reward': float64,
        'states': Tensor(shape=(71,), dtype=float64),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_idテンソル
地平線テンソルint32
ステップデータセット
ステップ/アクションテンソル(7、) float64
ステップ/割引テンソルint32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観察/オブジェクトテンソル(14) float64
ステップ/観察/robot0_eef_posテンソル(3) float64エンドエフェクタの位置
ステップ/観察/robot0_eef_quatテンソル(4) float64エンドエフェクタの向き
ステップ/観察/robot0_eef_vel_angテンソル(3) float64エンドエフェクタ角速度
ステップ/観察/robot0_eef_vel_linテンソル(3) float64エンドエフェクタ直交速度
ステップ/観察/robot0_gripper_qposテンソル(2) float64グリッパー位置
ステップ/観察/robot0_gripper_qvelテンソル(2) float64グリッパ速度
steps/observation/robot0_joint_posテンソル(7、) float64 7自由度の関節位置
ステップ/観測/robot0_joint_pos_cosテンソル(7、) float64
ステップ/観測/robot0_joint_pos_sinテンソル(7、) float64
steps/observation/robot0_joint_velテンソル(7、) float64 7自由度の関節速度
ステップ/報酬テンソルfloat64
ステップ/状態テンソル(71) float64

  • 説明:

Robomimic マシンで生成されたデータセットは、密な報酬でトレーニングされた Soft Actor Critic エージェントを使用して収集されました。各データセットは、エージェントのリプレイ バッファで構成されます。

各タスクには 2 つのバージョンがあります。1 つは低次元観測 ( low_dim ) で、もう 1 つは画像 ( image ) です。

データセットはRLDS 形式に従って、ステップとエピソードを表します。

@inproceedings{robomimic2021,
  title={What Matters in Learning from Offline Human Demonstrations for Robot Manipulation},
  author={Ajay Mandlekar and Danfei Xu and Josiah Wong and Soroush Nasiriany
          and Chen Wang and Rohun Kulkarni and Li Fei-Fei and Silvio Savarese
          and Yuke Zhu and Roberto Mart\'{i}n-Mart\'{i}n},
  booktitle={Conference on Robot Learning},
  year={2021}
}

robomimic_mg/lift_mg_image (デフォルト設定)

  • ダウンロードサイズ: 18.04 GiB

  • データセットサイズ: 2.73 GiB

  • 自動キャッシュ(ドキュメント): いいえ

  • スプリット:

スプリット
'train' 1,500
  • 機能構造:
FeaturesDict({
    'episode_id': string,
    'horizon': int32,
    'steps': Dataset({
        'action': Tensor(shape=(7,), dtype=float64),
        'discount': int32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'agentview_image': Image(shape=(84, 84, 3), dtype=uint8),
            'object': Tensor(shape=(10,), dtype=float64),
            'robot0_eef_pos': Tensor(shape=(3,), dtype=float64),
            'robot0_eef_quat': Tensor(shape=(4,), dtype=float64),
            'robot0_eef_vel_ang': Tensor(shape=(3,), dtype=float64),
            'robot0_eef_vel_lin': Tensor(shape=(3,), dtype=float64),
            'robot0_eye_in_hand_image': Image(shape=(84, 84, 3), dtype=uint8),
            'robot0_gripper_qpos': Tensor(shape=(2,), dtype=float64),
            'robot0_gripper_qvel': Tensor(shape=(2,), dtype=float64),
            'robot0_joint_pos': Tensor(shape=(7,), dtype=float64),
            'robot0_joint_pos_cos': Tensor(shape=(7,), dtype=float64),
            'robot0_joint_pos_sin': Tensor(shape=(7,), dtype=float64),
            'robot0_joint_vel': Tensor(shape=(7,), dtype=float64),
        }),
        'reward': float64,
        'states': Tensor(shape=(32,), dtype=float64),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_idテンソル
地平線テンソルint32
ステップデータセット
ステップ/アクションテンソル(7、) float64
ステップ/割引テンソルint32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観察/agentview_image画像(84、84、3) uint8
ステップ/観察/オブジェクトテンソル(10) float64
ステップ/観察/robot0_eef_posテンソル(3) float64エンドエフェクタの位置
ステップ/観察/robot0_eef_quatテンソル(4) float64エンドエフェクタの向き
ステップ/観察/robot0_eef_vel_angテンソル(3) float64エンドエフェクタ角速度
ステップ/観察/robot0_eef_vel_linテンソル(3) float64エンドエフェクタ直交速度
steps/observation/robot0_eye_in_hand_image画像(84、84、3) uint8
ステップ/観察/robot0_gripper_qposテンソル(2) float64グリッパー位置
ステップ/観察/robot0_gripper_qvelテンソル(2) float64グリッパ速度
steps/observation/robot0_joint_posテンソル(7、) float64 7自由度の関節位置
ステップ/観測/robot0_joint_pos_cosテンソル(7、) float64
ステップ/観測/robot0_joint_pos_sinテンソル(7、) float64
steps/observation/robot0_joint_velテンソル(7、) float64 7自由度の関節速度
ステップ/報酬テンソルfloat64
ステップ/状態テンソル(32) float64

ロボミミック_mg/リフト_mg_low_dim

  • ダウンロードサイズ: 302.25 MiB

  • データセットのサイズ: 195.10 MiB

  • 自動キャッシュ(ドキュメント): shuffle_files=Falseの場合のみ (トレーニング)

  • スプリット:

スプリット
'train' 1,500
  • 機能構造:
FeaturesDict({
    'episode_id': string,
    'horizon': int32,
    'steps': Dataset({
        'action': Tensor(shape=(7,), dtype=float64),
        'discount': int32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'object': Tensor(shape=(10,), dtype=float64),
            'robot0_eef_pos': Tensor(shape=(3,), dtype=float64),
            'robot0_eef_quat': Tensor(shape=(4,), dtype=float64),
            'robot0_eef_vel_ang': Tensor(shape=(3,), dtype=float64),
            'robot0_eef_vel_lin': Tensor(shape=(3,), dtype=float64),
            'robot0_gripper_qpos': Tensor(shape=(2,), dtype=float64),
            'robot0_gripper_qvel': Tensor(shape=(2,), dtype=float64),
            'robot0_joint_pos': Tensor(shape=(7,), dtype=float64),
            'robot0_joint_pos_cos': Tensor(shape=(7,), dtype=float64),
            'robot0_joint_pos_sin': Tensor(shape=(7,), dtype=float64),
            'robot0_joint_vel': Tensor(shape=(7,), dtype=float64),
        }),
        'reward': float64,
        'states': Tensor(shape=(32,), dtype=float64),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_idテンソル
地平線テンソルint32
ステップデータセット
ステップ/アクションテンソル(7、) float64
ステップ/割引テンソルint32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観察/オブジェクトテンソル(10) float64
ステップ/観察/robot0_eef_posテンソル(3) float64エンドエフェクタの位置
ステップ/観察/robot0_eef_quatテンソル(4) float64エンドエフェクタの向き
ステップ/観察/robot0_eef_vel_angテンソル(3) float64エンドエフェクタ角速度
ステップ/観察/robot0_eef_vel_linテンソル(3) float64エンドエフェクタ直交速度
ステップ/観察/robot0_gripper_qposテンソル(2) float64グリッパー位置
ステップ/観察/robot0_gripper_qvelテンソル(2) float64グリッパ速度
steps/observation/robot0_joint_posテンソル(7、) float64 7自由度の関節位置
ステップ/観測/robot0_joint_pos_cosテンソル(7、) float64
ステップ/観測/robot0_joint_pos_sinテンソル(7、) float64
steps/observation/robot0_joint_velテンソル(7、) float64 7自由度の関節速度
ステップ/報酬テンソルfloat64
ステップ/状態テンソル(32) float64

ロボミミック_mg/can_mg_image

  • ダウンロードサイズ: 47.14 GiB

  • データセットサイズ: 11.15 GiB

  • 自動キャッシュ(ドキュメント): いいえ

  • スプリット:

スプリット
'train' 3,900
  • 機能構造:
FeaturesDict({
    'episode_id': string,
    'horizon': int32,
    'steps': Dataset({
        'action': Tensor(shape=(7,), dtype=float64),
        'discount': int32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'agentview_image': Image(shape=(84, 84, 3), dtype=uint8),
            'object': Tensor(shape=(14,), dtype=float64),
            'robot0_eef_pos': Tensor(shape=(3,), dtype=float64),
            'robot0_eef_quat': Tensor(shape=(4,), dtype=float64),
            'robot0_eef_vel_ang': Tensor(shape=(3,), dtype=float64),
            'robot0_eef_vel_lin': Tensor(shape=(3,), dtype=float64),
            'robot0_eye_in_hand_image': Image(shape=(84, 84, 3), dtype=uint8),
            'robot0_gripper_qpos': Tensor(shape=(2,), dtype=float64),
            'robot0_gripper_qvel': Tensor(shape=(2,), dtype=float64),
            'robot0_joint_pos': Tensor(shape=(7,), dtype=float64),
            'robot0_joint_pos_cos': Tensor(shape=(7,), dtype=float64),
            'robot0_joint_pos_sin': Tensor(shape=(7,), dtype=float64),
            'robot0_joint_vel': Tensor(shape=(7,), dtype=float64),
        }),
        'reward': float64,
        'states': Tensor(shape=(71,), dtype=float64),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_idテンソル
地平線テンソルint32
ステップデータセット
ステップ/アクションテンソル(7、) float64
ステップ/割引テンソルint32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観察/agentview_image画像(84、84、3) uint8
ステップ/観察/オブジェクトテンソル(14) float64
ステップ/観察/robot0_eef_posテンソル(3) float64エンドエフェクタの位置
ステップ/観察/robot0_eef_quatテンソル(4) float64エンドエフェクタの向き
ステップ/観察/robot0_eef_vel_angテンソル(3) float64エンドエフェクタ角速度
ステップ/観察/robot0_eef_vel_linテンソル(3) float64エンドエフェクタ直交速度
steps/observation/robot0_eye_in_hand_image画像(84、84、3) uint8
ステップ/観察/robot0_gripper_qposテンソル(2) float64グリッパー位置
ステップ/観察/robot0_gripper_qvelテンソル(2) float64グリッパ速度
steps/observation/robot0_joint_posテンソル(7、) float64 7自由度の関節位置
ステップ/観測/robot0_joint_pos_cosテンソル(7、) float64
ステップ/観測/robot0_joint_pos_sinテンソル(7、) float64
steps/observation/robot0_joint_velテンソル(7、) float64 7自由度の関節速度
ステップ/報酬テンソルfloat64
ステップ/状態テンソル(71) float64

ロボミミック_mg/can_mg_low_dim

  • ダウンロードサイズ: 1.01 GiB

  • データセットのサイズ: 697.71 MiB

  • 自動キャッシュ(ドキュメント): いいえ

  • スプリット:

スプリット
'train' 3,900
  • 機能構造:
FeaturesDict({
    'episode_id': string,
    'horizon': int32,
    'steps': Dataset({
        'action': Tensor(shape=(7,), dtype=float64),
        'discount': int32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'object': Tensor(shape=(14,), dtype=float64),
            'robot0_eef_pos': Tensor(shape=(3,), dtype=float64),
            'robot0_eef_quat': Tensor(shape=(4,), dtype=float64),
            'robot0_eef_vel_ang': Tensor(shape=(3,), dtype=float64),
            'robot0_eef_vel_lin': Tensor(shape=(3,), dtype=float64),
            'robot0_gripper_qpos': Tensor(shape=(2,), dtype=float64),
            'robot0_gripper_qvel': Tensor(shape=(2,), dtype=float64),
            'robot0_joint_pos': Tensor(shape=(7,), dtype=float64),
            'robot0_joint_pos_cos': Tensor(shape=(7,), dtype=float64),
            'robot0_joint_pos_sin': Tensor(shape=(7,), dtype=float64),
            'robot0_joint_vel': Tensor(shape=(7,), dtype=float64),
        }),
        'reward': float64,
        'states': Tensor(shape=(71,), dtype=float64),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
episode_idテンソル
地平線テンソルint32
ステップデータセット
ステップ/アクションテンソル(7、) float64
ステップ/割引テンソルint32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/観察特徴辞書
ステップ/観察/オブジェクトテンソル(14) float64
ステップ/観察/robot0_eef_posテンソル(3) float64エンドエフェクタの位置
ステップ/観察/robot0_eef_quatテンソル(4) float64エンドエフェクタの向き
ステップ/観察/robot0_eef_vel_angテンソル(3) float64エンドエフェクタ角速度
ステップ/観察/robot0_eef_vel_linテンソル(3) float64エンドエフェクタ直交速度
ステップ/観察/robot0_gripper_qposテンソル(2) float64グリッパー位置
ステップ/観察/robot0_gripper_qvelテンソル(2) float64グリッパ速度
steps/observation/robot0_joint_posテンソル(7、) float64 7自由度の関節位置
ステップ/観測/robot0_joint_pos_cosテンソル(7、) float64
ステップ/観測/robot0_joint_pos_sinテンソル(7、) float64
steps/observation/robot0_joint_velテンソル(7、) float64 7自由度の関節速度
ステップ/報酬テンソルfloat64
ステップ/状態テンソル(71) float64