الحركة

  • الوصف :

تم إنشاء مجموعات البيانات مع وكيل SAC مدرب على المكافأة البيئية لمهام حركة MuJoCo. تُستخدم مجموعات البيانات هذه في ما يهم لتعلم التقليد العدائي؟ أورسيني وآخرون. 2021 .

تتبع مجموعات البيانات تنسيق RLDS لتمثيل الخطوات والحلقات

@article{orsini2021matters,
  title={What Matters for Adversarial Imitation Learning?},
  author={Orsini, Manu and Raichuk, Anton and Hussenot, L{'e}onard and Vincent, Damien and Dadashi, Robert and Girgin, Sertan and Geist, Matthieu and Bachem, Olivier and Pietquin, Olivier and Andrychowicz, Marcin},
  journal={International Conference in Machine Learning},
  year={2021}
}

locomotion / ant_sac_1M_single_policy_stochastic (التكوين الافتراضي)

  • وصف التكوين : مجموعة بيانات تم إنشاؤها بواسطة وكيل SAC تم تدريبه على مليون خطوة لـ Ant.

  • حجم التحميل : 6.49 MiB

  • حجم مجموعة البيانات : 23.02 MiB

  • التخزين المؤقت التلقائي ( الوثائق ): نعم

  • الانقسامات :

انشق، مزق أمثلة
'train' 50
  • هيكل الميزة :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(111,), dtype=float32),
        'reward': float32,
    }),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
خطوات مجموعة البيانات
خطوات / عمل موتر (8 ،) تعويم 32
خطوات / خصم موتر تعويم 32
الخطوات / is_first موتر منطقي
الخطوات / is_last موتر منطقي
الخطوات / is_terminal موتر منطقي
خطوات / ملاحظة موتر (111 ،) تعويم 32
خطوات / مكافأة موتر تعويم 32

الحركة / hopper_sac_1M_single_policy_stochastic

  • وصف التكوين : مجموعة البيانات التي تم إنشاؤها بواسطة وكيل SAC تم تدريبه على مليون خطوة لـ Hopper.

  • حجم التحميل : 2.26 MiB

  • حجم مجموعة البيانات : 2.62 MiB

  • التخزين المؤقت التلقائي ( الوثائق ): نعم

  • الانقسامات :

انشق، مزق أمثلة
'train' 50
  • هيكل الميزة :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(3,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(11,), dtype=float32),
        'reward': float32,
    }),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
خطوات مجموعة البيانات
خطوات / عمل موتر (3 ،) تعويم 32
خطوات / خصم موتر تعويم 32
الخطوات / is_first موتر منطقي
الخطوات / is_last موتر منطقي
الخطوات / is_terminal موتر منطقي
خطوات / ملاحظة موتر (11 ،) تعويم 32
خطوات / مكافأة موتر تعويم 32

الحركة / halfcheetah_sac_1M_single_policy_stochastic

  • وصف التكوين : مجموعة البيانات التي تم إنشاؤها بواسطة وكيل SAC تم تدريبه على مليون خطوة لـ HalfCheetah.

  • حجم التحميل : 4.49 MiB

  • حجم مجموعة البيانات : 4.93 MiB

  • التخزين المؤقت التلقائي ( الوثائق ): نعم

  • الانقسامات :

انشق، مزق أمثلة
'train' 50
  • هيكل الميزة :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(17,), dtype=float32),
        'reward': float32,
    }),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
خطوات مجموعة البيانات
خطوات / عمل موتر (6 ،) تعويم 32
خطوات / خصم موتر تعويم 32
الخطوات / is_first موتر منطقي
الخطوات / is_last موتر منطقي
الخطوات / is_terminal موتر منطقي
خطوات / ملاحظة موتر (17 ،) تعويم 32
خطوات / مكافأة موتر تعويم 32

الحركة / المشاة 2d_sac_1M_single_policy_stochastic

  • وصف التكوين : مجموعة البيانات التي تم إنشاؤها بواسطة وكيل SAC تم تدريبه على مليون خطوة لـ Walker2d.

  • حجم التحميل : 4.35 MiB

  • حجم مجموعة البيانات : 4.91 MiB

  • التخزين المؤقت التلقائي ( الوثائق ): نعم

  • الانقسامات :

انشق، مزق أمثلة
'train' 50
  • هيكل الميزة :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(17,), dtype=float32),
        'reward': float32,
    }),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
خطوات مجموعة البيانات
خطوات / عمل موتر (6 ،) تعويم 32
خطوات / خصم موتر تعويم 32
الخطوات / is_first موتر منطقي
الخطوات / is_last موتر منطقي
الخطوات / is_terminal موتر منطقي
خطوات / ملاحظة موتر (17 ،) تعويم 32
خطوات / مكافأة موتر تعويم 32

الحركة / humanoid_sac_15M_single_policy_stochastic

  • وصف التكوين : مجموعة البيانات التي تم إنشاؤها بواسطة وكيل SAC تم تدريبه على 15 مليون خطوة لـ Humanoid.

  • حجم التحميل : 192.78 MiB

  • حجم مجموعة البيانات : 300.94 MiB

  • التخزين المؤقت التلقائي ( التوثيق ): لا

  • الانقسامات :

انشق، مزق أمثلة
'train' 200
  • هيكل الميزة :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(17,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(376,), dtype=float32),
        'reward': float32,
    }),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
خطوات مجموعة البيانات
خطوات / عمل موتر (17 ،) تعويم 32
خطوات / خصم موتر تعويم 32
الخطوات / is_first موتر منطقي
الخطوات / is_last موتر منطقي
الخطوات / is_terminal موتر منطقي
خطوات / ملاحظة موتر (376 ،) تعويم 32
خطوات / مكافأة موتر تعويم 32