アロハモバイル

  • 説明

実際のデータセット。両手操作で全身制御を必要とするモバイル操作タスクを模倣します。各タスクにつき 50 回のデモン​​ストレーション。

スプリット
'train' 276
  • 機能の構造:
FeaturesDict({
    'episode_metadata': FeaturesDict({
        'file_path': string,
    }),
    'steps': Dataset({
        'action': Tensor(shape=(16,), dtype=float32),
        'discount': Scalar(shape=(), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'language_instruction': string,
        'observation': FeaturesDict({
            'cam_high': Image(shape=(480, 640, 3), dtype=uint8),
            'cam_left_wrist': Image(shape=(480, 640, 3), dtype=uint8),
            'cam_right_wrist': Image(shape=(480, 640, 3), dtype=uint8),
            'state': Tensor(shape=(14,), dtype=float32),
        }),
        'reward': Scalar(shape=(), dtype=float32),
    }),
})
  • 機能ドキュメント:
特徴クラスDタイプ説明
特徴辞書
エピソード_メタデータ特徴辞書
エピソードメタデータ/ファイルパステンソル
ステップデータセット
ステップ/アクションテンソル(16,) float32
歩数/割引スカラーfloat32
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/言語説明テンソル
ステップ/観察特徴辞書
歩数/観察/cam_high画像(480、640、3) uint8
歩数/観察/cam_left_wrist画像(480、640、3) uint8
歩数/観察/cam_right_wrist画像(480、640、3) uint8
ステップ/観察/状態テンソル(14,) float32
歩数/報酬スカラーfloat32
  • 引用
@inproceedings{fu2024mobile,author = {Fu, Zipeng and Zhao, Tony Z. and Finn, Chelsea},title = {Mobile ALOHA: Learning Bimanual Mobile Manipulation with Low-Cost Whole-Body Teleoperation},booktitle = {arXiv},year = {2024},}