TFDS はCroissant 🥐 形式をサポートするようになりました。詳細については、ドキュメントをお読みください。

このページは Cloud Translation API によって翻訳されました。

移動

説明：

データセットは、MuJoCo 移動タスクの環境報酬でトレーニングされた SAC エージェントを使用して作成されました。これらのデータセットは、「敵対的模倣学習にとって何が重要か?」で使用されます。オルシーニら。 2021年。

データセットは、ステップとエピソードを表すRLDS 形式に従っています。

ホームページ: https://github.com/google-research/rlds
ソースコード: tfds.rlds.datasets.locomotion.Locomotion
バージョン:
- 1.0.0 (デフォルト): 初期リリース。
監視キー( as_supervised docを参照): None
図( tfds.show_examples ): サポートされていません。
引用：

@article{orsini2021matters,
  title={What Matters for Adversarial Imitation Learning?},
  author={Orsini, Manu and Raichuk, Anton and Hussenot, L{'e}onard and Vincent, Damien and Dadashi, Robert and Girgin, Sertan and Geist, Matthieu and Bachem, Olivier and Pietquin, Olivier and Andrychowicz, Marcin},
  journal={International Conference in Machine Learning},
  year={2021}
}

locomotion/ant_sac_1M_single_policy_stochastic (デフォルト設定)

構成の説明: Ant の 1M ステップでトレーニングされた SAC エージェントによって生成されたデータセット。
ダウンロードサイズ: 6.49 MiB
データセットのサイズ: 23.02 MiB
自動キャッシュ(ドキュメント): はい
分割:

スプリット	例
`'train'`	50

機能の構造:

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(111,), dtype=float32),
        'reward': float32,
    }),
})

機能ドキュメント:

特徴	クラス	形	Dタイプ
	特徴辞書
ステップ	データセット
ステップ/アクション	テンソル	(8,)	float32
歩数/割引	テンソル		float32
ステップ/is_first	テンソル		ブール
ステップ/is_last	テンソル		ブール
ステップ/is_terminal	テンソル		ブール
ステップ/観察	テンソル	(111,)	float32
歩数/報酬	テンソル		float32

例( tfds.as_dataframe ):

locomotion/hopper_sac_1M_single_policy_stochastic

構成の説明: Hopper の 1M ステップ用にトレーニングされた SAC エージェントによって生成されたデータセット。
ダウンロードサイズ: 2.26 MiB
データセットのサイズ: 2.62 MiB
自動キャッシュ(ドキュメント): はい
分割:

スプリット	例
`'train'`	50

機能の構造:

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(3,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(11,), dtype=float32),
        'reward': float32,
    }),
})

機能ドキュメント:

特徴	クラス	形	Dタイプ
	特徴辞書
ステップ	データセット
ステップ/アクション	テンソル	(3,)	float32
歩数/割引	テンソル		float32
ステップ/is_first	テンソル		ブール
ステップ/is_last	テンソル		ブール
ステップ/is_terminal	テンソル		ブール
ステップ/観察	テンソル	(11,)	float32
歩数/報酬	テンソル		float32

例( tfds.as_dataframe ):

locomotion/halfcheetah_sac_1M_single_policy_stochastic

構成の説明: HalfCheetah の 1M ステップでトレーニングされた SAC エージェントによって生成されたデータセット。
ダウンロードサイズ: 4.49 MiB
データセットのサイズ: 4.93 MiB
自動キャッシュ(ドキュメント): はい
分割:

スプリット	例
`'train'`	50

機能の構造:

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(17,), dtype=float32),
        'reward': float32,
    }),
})

機能ドキュメント:

特徴	クラス	形	Dタイプ
	特徴辞書
ステップ	データセット
ステップ/アクション	テンソル	(6,)	float32
歩数/割引	テンソル		float32
ステップ/is_first	テンソル		ブール
ステップ/is_last	テンソル		ブール
ステップ/is_terminal	テンソル		ブール
ステップ/観察	テンソル	(17,)	float32
歩数/報酬	テンソル		float32

例( tfds.as_dataframe ):

locomotion/walker2d_sac_1M_single_policy_stochastic

構成の説明: Walker2d の 1M ステップ用にトレーニングされた SAC エージェントによって生成されたデータセット。
ダウンロードサイズ: 4.35 MiB
データセットのサイズ: 4.91 MiB
自動キャッシュ(ドキュメント): はい
分割:

スプリット	例
`'train'`	50

機能の構造:

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(17,), dtype=float32),
        'reward': float32,
    }),
})

機能ドキュメント:

特徴	クラス	形	Dタイプ
	特徴辞書
ステップ	データセット
ステップ/アクション	テンソル	(6,)	float32
歩数/割引	テンソル		float32
ステップ/is_first	テンソル		ブール
ステップ/is_last	テンソル		ブール
ステップ/is_terminal	テンソル		ブール
ステップ/観察	テンソル	(17,)	float32
歩数/報酬	テンソル		float32

例( tfds.as_dataframe ):

locomotion/humanoid_sac_15M_single_policy_stochastic

構成の説明: Humanoid の 15M ステップでトレーニングされた SAC エージェントによって生成されたデータセット。
ダウンロードサイズ: 192.78 MiB
データセットのサイズ: 300.94 MiB
自動キャッシュ(ドキュメント): いいえ
分割:

スプリット	例
`'train'`	200

機能の構造:

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(17,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(376,), dtype=float32),
        'reward': float32,
    }),
})

機能ドキュメント:

特徴	クラス	形	Dタイプ
	特徴辞書
ステップ	データセット
ステップ/アクション	テンソル	(17,)	float32
歩数/割引	テンソル		float32
ステップ/is_first	テンソル		ブール
ステップ/is_last	テンソル		ブール
ステップ/is_terminal	テンソル		ブール
ステップ/観察	テンソル	(376,)	float32
歩数/報酬	テンソル		float32

例( tfds.as_dataframe ):

移動 コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

locomotion/ant_sac_1M_single_policy_stochastic (デフォルト設定)

locomotion/hopper_sac_1M_single_policy_stochastic

locomotion/halfcheetah_sac_1M_single_policy_stochastic

locomotion/walker2d_sac_1M_single_policy_stochastic

locomotion/humanoid_sac_15M_single_policy_stochastic

移動