usc_cloth_sim_converted_externally_to_rlds

  • 説明

Franka クロス インタラクション タスク

スプリット
'train' 800
'val' 200
  • 機能の構造:
FeaturesDict({
    'episode_metadata': FeaturesDict({
        'file_path': Text(shape=(), dtype=string),
    }),
    'steps': Dataset({
        'action': Tensor(shape=(4,), dtype=float32),
        'discount': Scalar(shape=(), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'language_embedding': Tensor(shape=(512,), dtype=float32),
        'language_instruction': Text(shape=(), dtype=string),
        'observation': FeaturesDict({
            'image': Image(shape=(32, 32, 3), dtype=uint8),
        }),
        'reward': Scalar(shape=(), dtype=float32),
    }),
})
  • 機能ドキュメント:
特徴クラスDタイプ説明
特徴辞書
エピソード_メタデータ特徴辞書
エピソードメタデータ/ファイルパス文章元のデータ ファイルへのパス。
ステップデータセット
ステップ/アクションテンソル(4,) float32ロボット アクションは、X、Y、Z ゴールとピッカー コマンドpicker<0.5 = 開く、picker>0.5 = 閉じるで構成されます。
歩数/割引スカラーfloat32割引が指定されている場合、デフォルトは 1 です。
ステップ/is_firstテンソルブール
ステップ/is_lastテンソルブール
ステップ/is_terminalテンソルブール
ステップ/言語_埋め込みテンソル(512,) float32コナ言語の埋め込み。 https://tfhub.dev/google/universal-sentence-encoder-large/5を参照してください。
ステップ/言語説明文章言語指導。
ステップ/観察特徴辞書
手順・観察・イメージ画像(32、32、3) uint8布の画像観察。
歩数/報酬スカラーfloat32 [0, 1] の正規化されたパフォーマンス メトリックとしての報酬。0 = 初期状態から変化なし。 1 = 完璧な折り目。-ve パフォーマンスは、生地が初期状態よりも悪化していることを意味します。
@article{salhotra2022dmfd,
    author={Salhotra, Gautam and Liu, I-Chun Arthur and Dominguez-Kuhne, Marcus and Sukhatme, Gaurav S.},
    journal={IEEE Robotics and Automation Letters},
    title={Learning Deformable Object Manipulation From Expert Demonstrations},
    year={2022},
    volume={7},
    number={4},
    pages={8775-8782},
    doi={10.1109/LRA.2022.3187843}
}