يدعم TFDS الآن تنسيق الكرواسون 🥐 ! اقرأ الوثائق لمعرفة المزيد.

تمت ترجمة هذه الصفحة بواسطة Cloud Translation API‏.

الحركة

وصف :

تم إنشاء مجموعات البيانات باستخدام وكيل SAC تم تدريبه على المكافأة البيئية لمهام التنقل MuJoCo. تُستخدم مجموعات البيانات هذه في ما هي الأمور المهمة لتعلم التقليد التنافسي؟ أورسيني وآخرون. 2021 .

تتبع مجموعات البيانات تنسيق RLDS لتمثيل الخطوات والحلقات

الصفحة الرئيسية : https://github.com/google-research/rlds
كود المصدر : tfds.rlds.datasets.locomotion.Locomotion
الإصدارات :
- 1.0.0 (افتراضي): الإصدار الأولي.
المفاتيح الخاضعة للإشراف (راجع as_supervised doc ): None
الشكل ( tfds.show_examples ): غير مدعوم.
الاقتباس :

@article{orsini2021matters,
  title={What Matters for Adversarial Imitation Learning?},
  author={Orsini, Manu and Raichuk, Anton and Hussenot, L{'e}onard and Vincent, Damien and Dadashi, Robert and Girgin, Sertan and Geist, Matthieu and Bachem, Olivier and Pietquin, Olivier and Andrychowicz, Marcin},
  journal={International Conference in Machine Learning},
  year={2021}
}

الحركة/ant_sac_1M_single_policy_stochastic (التكوين الافتراضي)

وصف التكوين : مجموعة البيانات التي تم إنشاؤها بواسطة وكيل SAC تم تدريبه على خطوات 1M لـ Ant.
حجم التحميل : 6.49 MiB
حجم مجموعة البيانات : 23.02 MiB
التخزين المؤقت التلقائي ( الوثائق ): نعم
الإنشقاقات :

ينقسم	أمثلة
`'train'`	50

هيكل الميزة :

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(111,), dtype=float32),
        'reward': float32,
    }),
})

وثائق الميزة :

ميزة	فصل	شكل	نوع D
	المميزاتDict
خطوات	مجموعة البيانات
الخطوات/الإجراء	الموتر	(8،)	float32
الخطوات/الخصم	الموتر		float32
الخطوات/is_first	الموتر		منطقي
الخطوات/is_last	الموتر		منطقي
الخطوات/is_terminal	الموتر		منطقي
الخطوات/الملاحظة	الموتر	(111،)	float32
خطوات/مكافأة	الموتر		float32

أمثلة ( tfds.as_dataframe ):

locomotion/hopper_sac_1M_single_policy_stochastic

وصف التكوين : مجموعة البيانات التي تم إنشاؤها بواسطة وكيل SAC تم تدريبه على خطوات 1M لـ Hopper.
حجم التحميل : 2.26 MiB
حجم مجموعة البيانات : 2.62 MiB
التخزين المؤقت التلقائي ( الوثائق ): نعم
الإنشقاقات :

ينقسم	أمثلة
`'train'`	50

هيكل الميزة :

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(3,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(11,), dtype=float32),
        'reward': float32,
    }),
})

وثائق الميزة :

ميزة	فصل	شكل	نوع D
	المميزاتDict
خطوات	مجموعة البيانات
الخطوات/الإجراء	الموتر	(3،)	float32
الخطوات/الخصم	الموتر		float32
الخطوات/is_first	الموتر		منطقي
الخطوات/is_last	الموتر		منطقي
الخطوات/is_terminal	الموتر		منطقي
الخطوات/الملاحظة	الموتر	(11،)	float32
خطوات/مكافأة	الموتر		float32

أمثلة ( tfds.as_dataframe ):

locomotion/halfcheetah_sac_1M_single_policy_stochastic

وصف التكوين : مجموعة البيانات التي تم إنشاؤها بواسطة وكيل SAC تم تدريبه على خطوات 1 مليون لـ HalfCheetah.
حجم التحميل : 4.49 MiB
حجم مجموعة البيانات : 4.93 MiB
التخزين المؤقت التلقائي ( الوثائق ): نعم
الإنشقاقات :

ينقسم	أمثلة
`'train'`	50

هيكل الميزة :

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(17,), dtype=float32),
        'reward': float32,
    }),
})

وثائق الميزة :

ميزة	فصل	شكل	نوع D
	المميزاتDict
خطوات	مجموعة البيانات
الخطوات/الإجراء	الموتر	(6،)	float32
الخطوات/الخصم	الموتر		float32
الخطوات/is_first	الموتر		منطقي
الخطوات/is_last	الموتر		منطقي
الخطوات/is_terminal	الموتر		منطقي
الخطوات/الملاحظة	الموتر	(17،)	float32
خطوات/مكافأة	الموتر		float32

أمثلة ( tfds.as_dataframe ):

locomotion/walker2d_sac_1M_single_policy_stochastic

وصف التكوين : مجموعة البيانات التي تم إنشاؤها بواسطة وكيل SAC تم تدريبه على خطوات 1M لـ Walker2d.
حجم التحميل : 4.35 MiB
حجم مجموعة البيانات : 4.91 MiB
التخزين المؤقت التلقائي ( الوثائق ): نعم
الإنشقاقات :

ينقسم	أمثلة
`'train'`	50

هيكل الميزة :

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(17,), dtype=float32),
        'reward': float32,
    }),
})

وثائق الميزة :

ميزة	فصل	شكل	نوع D
	المميزاتDict
خطوات	مجموعة البيانات
الخطوات/الإجراء	الموتر	(6،)	float32
الخطوات/الخصم	الموتر		float32
الخطوات/is_first	الموتر		منطقي
الخطوات/is_last	الموتر		منطقي
الخطوات/is_terminal	الموتر		منطقي
الخطوات/الملاحظة	الموتر	(17،)	float32
خطوات/مكافأة	الموتر		float32

أمثلة ( tfds.as_dataframe ):

الحركة/humanoid_sac_15M_single_policy_stochastic

وصف التكوين : مجموعة البيانات التي تم إنشاؤها بواسطة وكيل SAC تم تدريبه على 15 مليون خطوة لـ Humanoid.
حجم التحميل : 192.78 MiB
حجم مجموعة البيانات : 300.94 MiB
التخزين المؤقت التلقائي ( الوثائق ): لا
الإنشقاقات :

ينقسم	أمثلة
`'train'`	200

هيكل الميزة :

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(17,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(376,), dtype=float32),
        'reward': float32,
    }),
})

وثائق الميزة :

ميزة	فصل	شكل	نوع D
	المميزاتDict
خطوات	مجموعة البيانات
الخطوات/الإجراء	الموتر	(17،)	float32
الخطوات/الخصم	الموتر		float32
الخطوات/is_first	الموتر		منطقي
الخطوات/is_last	الموتر		منطقي
الخطوات/is_terminal	الموتر		منطقي
الخطوات/الملاحظة	الموتر	(376،)	float32
خطوات/مكافأة	الموتر		float32

أمثلة ( tfds.as_dataframe ):

الحركة تنظيم صفحاتك في مجموعات يمكنك حفظ المحتوى وتصنيفه حسب إعداداتك المفضّلة.