Google I/O में ट्यूनिंग के लिए धन्यवाद। मांग पर सभी सत्र देखें मांग पर देखें

d4rl_antmaze

  • विवरण :

D4RL ऑफ़लाइन रीइन्फोर्समेंट लर्निंग के लिए एक ओपन-सोर्स बेंचमार्क है। यह प्रशिक्षण और बेंचमार्किंग एल्गोरिदम के लिए मानकीकृत वातावरण और डेटासेट प्रदान करता है।

डेटासेट चरण और एपिसोड का प्रतिनिधित्व करने के लिए आरएलडीएस प्रारूप का पालन करते हैं।

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float32),
        'discount': float32,
        'infos': FeaturesDict({
            'goal': Tensor(shape=(2,), dtype=float32),
            'qpos': Tensor(shape=(15,), dtype=float32),
            'qvel': Tensor(shape=(14,), dtype=float32),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(29,), dtype=float32),
        'reward': float32,
    }),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
कदम डेटासेट
कदम / कार्रवाई टेन्सर (8,) फ्लोट32
चरण/छूट टेन्सर फ्लोट32
कदम/जानकारी विशेषताएं डिक्ट
कदम/जानकारी/लक्ष्य टेन्सर (2,) फ्लोट32
चरण/जानकारी/qpos टेन्सर (15,) फ्लोट32
कदम/जानकारी/qvel टेन्सर (14,) फ्लोट32
चरण/is_first टेन्सर बूल
चरण/is_last टेन्सर बूल
कदम/is_terminal टेन्सर बूल
चरण/अवलोकन टेन्सर (29,) फ्लोट32
कदम / इनाम टेन्सर फ्लोट32
  • पर्यवेक्षित कुंजियाँ ( as_supervised doc देखें): None

  • चित्र ( tfds.show_examples ): समर्थित नहीं है।

  • उद्धरण :

@misc{fu2020d4rl,
    title={D4RL: Datasets for Deep Data-Driven Reinforcement Learning},
    author={Justin Fu and Aviral Kumar and Ofir Nachum and George Tucker and Sergey Levine},
    year={2020},
    eprint={2004.07219},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

d4rl_antmaze/umaze-v0 (डिफ़ॉल्ट कॉन्फ़िगरेशन)

  • डाउनलोड आकार : 221.76 MiB

  • डेटासेट का आकार : 274.83 MiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 10,154

d4rl_antmaze/umaze-diverse-v0

  • डाउनलोड आकार : 220.16 MiB

  • डेटासेट का आकार : 270.23 MiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,154

d4rl_antmaze/मीडियम-प्ले-v0

  • डाउनलोड आकार : 220.40 MiB

  • डेटासेट का आकार : 275.20 MiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 10,695

d4rl_antmaze/मीडियम-डाइवर्स-v0

  • डाउनलोड का आकार : 220.39 MiB

  • डेटासेट का आकार : 271.18 MiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 2,924

d4rl_antmaze/बड़े-विविध-v0

  • डाउनलोड आकार : 220.47 MiB

  • डेटासेट का आकार : 273.36 MiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 7,141

d4rl_antmaze/लार्ज-प्ले-v0

  • डाउनलोड आकार : 220.19 MiB

  • डेटासेट का आकार : 276.61 MiB

  • विभाजन :

विभाजित करना उदाहरण
'train' 13,458