d4rl_antmaze

  • תיאור :

D4RL הוא אמת מידה בקוד פתוח ללמידת חיזוק לא מקוון. הוא מספק סביבות סטנדרטיות ומערכי נתונים עבור אלגוריתמי הדרכה ומידוד.

מערכי הנתונים פועלים לפי פורמט RLDS כדי לייצג שלבים ופרקים.

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float32),
        'discount': float32,
        'infos': FeaturesDict({
            'goal': Tensor(shape=(2,), dtype=float32),
            'qpos': Tensor(shape=(15,), dtype=float32),
            'qvel': Tensor(shape=(14,), dtype=float32),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(29,), dtype=float32),
        'reward': float32,
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (8,) לצוף32
צעדים/הנחה מוֹתֵחַ לצוף32
שלבים/מידע FeaturesDict
צעדים/מידע/מטרה מוֹתֵחַ (2,) לצוף32
צעדים/מידע/qpos מוֹתֵחַ (15,) לצוף32
צעדים/מידע/qvel מוֹתֵחַ (14,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית מוֹתֵחַ (29,) לצוף32
צעדים/פרס מוֹתֵחַ לצוף32
@misc{fu2020d4rl,
    title={D4RL: Datasets for Deep Data-Driven Reinforcement Learning},
    author={Justin Fu and Aviral Kumar and Ofir Nachum and George Tucker and Sergey Levine},
    year={2020},
    eprint={2004.07219},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

d4rl_antmaze/umaze-v0 (תצורת ברירת המחדל)

  • גודל הורדה : 221.76 MiB

  • גודל ערכת נתונים : 274.83 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'train' 10,154

d4rl_antmaze/umaze-diverse-v0

  • גודל הורדה : 220.16 MiB

  • גודל ערכת נתונים : 270.23 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'train' 1,154

d4rl_antmaze/medium-play-v0

  • גודל הורדה : 220.40 MiB

  • גודל מערך נתונים : 275.20 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'train' 10,695

d4rl_antmaze/medium-diverse-v0

  • גודל הורדה : 220.39 MiB

  • גודל ערכת נתונים : 271.18 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'train' 2,924

d4rl_antmaze/large-diverse-v0

  • גודל הורדה : 220.47 MiB

  • גודל ערכת נתונים : 273.36 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'train' 7,141

d4rl_antmaze/large-play-v0

  • גודל הורדה : 220.19 MiB

  • גודל ערכת נתונים : 276.61 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'train' 13,458

d4rl_antmaze/umaze-v2

  • גודל הורדה : 221.76 MiB

  • גודל ערכת נתונים : 274.83 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'train' 10,154

d4rl_antmaze/umaze-diverse-v2

  • גודל הורדה : 220.16 MiB

  • גודל ערכת נתונים : 270.20 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'train' 1,036

d4rl_antmaze/medium-play-v2

  • גודל הורדה : 220.40 MiB

  • גודל ערכת נתונים : 275.22 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'train' 10,768

d4rl_antmaze/medium-diverse-v2

  • גודל הורדה : 220.39 MiB

  • גודל ערכת נתונים : 271.19 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'train' 2,959

d4rl_antmaze/large-diverse-v2

  • גודל הורדה : 220.47 MiB

  • גודל ערכת נתונים : 273.38 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'train' 7,189

d4rl_antmaze/large-play-v2

  • גודל הורדה : 220.18 MiB

  • גודל מערך נתונים : 276.63 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'train' 13,517