d4rl_antmaze

  • תיאור :

D4RL הוא אמת מידה בקוד פתוח ללמידת חיזוק לא מקוון. הוא מספק סביבות סטנדרטיות ומערכי נתונים עבור אלגוריתמי הדרכה ומידוד.

מערכי הנתונים פועלים לפי פורמט RLDS כדי לייצג שלבים ופרקים.

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=tf.float32),
        'discount': tf.float32,
        'infos': FeaturesDict({
            'goal': Tensor(shape=(2,), dtype=tf.float32),
            'qpos': Tensor(shape=(15,), dtype=tf.float32),
            'qvel': Tensor(shape=(14,), dtype=tf.float32),
        }),
        'is_first': tf.bool,
        'is_last': tf.bool,
        'is_terminal': tf.bool,
        'observation': Tensor(shape=(29,), dtype=tf.float32),
        'reward': tf.float32,
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (8,) tf.float32
צעדים/הנחה מוֹתֵחַ tf.float32
שלבים/מידע FeaturesDict
צעדים/מידע/מטרה מוֹתֵחַ (2,) tf.float32
צעדים/מידע/qpos מוֹתֵחַ (15,) tf.float32
צעדים/מידע/qvel מוֹתֵחַ (14,) tf.float32
צעדים/הוא_ראשון מוֹתֵחַ tf.bool
צעדים/הוא_אחרון מוֹתֵחַ tf.bool
steps/is_terminal מוֹתֵחַ tf.bool
צעדים/תצפית מוֹתֵחַ (29,) tf.float32
צעדים/פרס מוֹתֵחַ tf.float32
@misc{fu2020d4rl,
    title={D4RL: Datasets for Deep Data-Driven Reinforcement Learning},
    author={Justin Fu and Aviral Kumar and Ofir Nachum and George Tucker and Sergey Levine},
    year={2020},
    eprint={2004.07219},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

d4rl_antmaze/umaze-v0 (תצורת ברירת המחדל)

  • גודל הורדה : 221.76 MiB

  • גודל ערכת נתונים: 274.83 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'train' 10,154

d4rl_antmaze/umaze-diverse-v0

  • גודל הורדה : 220.16 MiB

  • גודל ערכת נתונים: 270.23 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'train' 1,154

d4rl_antmaze/medium-play-v0

  • גודל הורדה : 220.40 MiB

  • גודל ערכת נתונים: 275.20 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'train' 10,695

d4rl_antmaze/medium-diverse-v0

  • גודל הורדה : 220.39 MiB

  • גודל ערכת נתונים: 271.18 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'train' 2,924

d4rl_antmaze/large-diverse-v0

  • גודל הורדה : 220.47 MiB

  • גודל ערכת נתונים: 273.36 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'train' 7,141

d4rl_antmaze/large-play-v0

  • גודל הורדה : 220.19 MiB

  • גודל ערכת נתונים: 276.61 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'train' 13,458