टीएफडीएस अब क्रोइसैन 🥐 प्रारूप का समर्थन करता है! अधिक जानने के लिए दस्तावेज़ पढ़ें.

इस पेज का अनुवाद Cloud Translation API से किया गया है.

d4rl_antmaze

विवरण :

D4RL ऑफ़लाइन सुदृढीकरण सीखने के लिए एक ओपन-सोर्स बेंचमार्क है। यह प्रशिक्षण और बेंचमार्किंग एल्गोरिदम के लिए मानकीकृत वातावरण और डेटासेट प्रदान करता है।

डेटासेट चरणों और एपिसोड का प्रतिनिधित्व करने के लिए आरएलडीएस प्रारूप का पालन करते हैं।

कॉन्फ़िगरेशन विवरण : कार्य और उसके संस्करणों के बारे में अधिक विवरण https://github.com/rail-berkeley/d4rl/wiki/Tasks#antmaze में देखें
मुखपृष्ठ : https://sites.google.com/view/d4rl-anonymous
स्रोत कोड : tfds.d4rl.d4rl_antmaze.D4rlAntmaze
संस्करण :
- 1.0.0 : प्रारंभिक रिलीज.
- 1.1.1 (डिफ़ॉल्ट): v2 डेटासेट जोड़े गए।
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
फ़ीचर संरचना :

FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float32),
        'discount': float32,
        'infos': FeaturesDict({
            'goal': Tensor(shape=(2,), dtype=float32),
            'qpos': Tensor(shape=(15,), dtype=float32),
            'qvel': Tensor(shape=(14,), dtype=float32),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(29,), dtype=float32),
        'reward': float32,
    }),
})

फ़ीचर दस्तावेज़ीकरण :

विशेषता	कक्षा	आकार	डीप्रकार
	फीचर्सडिक्ट
कदम	डेटासेट
कदम/कार्रवाई	टेन्सर	(8,)	फ्लोट32
कदम/छूट	टेन्सर		फ्लोट32
चरण/जानकारी	फीचर्सडिक्ट
चरण/जानकारी/लक्ष्य	टेन्सर	(2,)	फ्लोट32
चरण/जानकारी/क्यूपीओएस	टेन्सर	(15,)	फ्लोट32
चरण/जानकारी/qvel	टेन्सर	(14,)	फ्लोट32
चरण/पहला है	टेन्सर		बूल
चरण/अंतिम है	टेन्सर		बूल
चरण/is_terminal	टेन्सर		बूल
चरण/अवलोकन	टेन्सर	(29,)	फ्लोट32
कदम/इनाम	टेन्सर		फ्लोट32

पर्यवेक्षित कुंजियाँ ( as_supervised doc देखें): None
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उद्धरण :

@misc{fu2020d4rl,
    title={D4RL: Datasets for Deep Data-Driven Reinforcement Learning},
    author={Justin Fu and Aviral Kumar and Ofir Nachum and George Tucker and Sergey Levine},
    year={2020},
    eprint={2004.07219},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

d4rl_antmaze/umaze-v0 (डिफ़ॉल्ट कॉन्फ़िगरेशन)

डाउनलोड आकार : 221.76 MiB
डेटासेट का आकार : 274.83 MiB
विभाजन :

विभाजित करना	उदाहरण
`'train'`	10,154

उदाहरण ( tfds.as_dataframe ):

d4rl_antmaze/umaze-divers-v0

डाउनलोड आकार : 220.16 MiB
डेटासेट का आकार : 270.23 MiB
विभाजन :

विभाजित करना	उदाहरण
`'train'`	1,154

उदाहरण ( tfds.as_dataframe ):

d4rl_antmaze/मीडियम-प्ले-v0

डाउनलोड आकार : 220.40 MiB
डेटासेट का आकार : 275.20 MiB
विभाजन :

विभाजित करना	उदाहरण
`'train'`	10,695

उदाहरण ( tfds.as_dataframe ):

d4rl_antmaze/मध्यम-विविध-v0

डाउनलोड आकार : 220.39 MiB
डेटासेट का आकार : 271.18 MiB
विभाजन :

विभाजित करना	उदाहरण
`'train'`	2,924

उदाहरण ( tfds.as_dataframe ):

d4rl_antmaze/large-divers-v0

डाउनलोड आकार : 220.47 MiB
डेटासेट का आकार : 273.36 MiB
विभाजन :

विभाजित करना	उदाहरण
`'train'`	7,141

उदाहरण ( tfds.as_dataframe ):

d4rl_antmaze/large-play-v0

डाउनलोड आकार : 220.19 MiB
डेटासेट का आकार : 276.61 MiB
विभाजन :

विभाजित करना	उदाहरण
`'train'`	13,458

उदाहरण ( tfds.as_dataframe ):

d4rl_antmaze/umaze-v2

डाउनलोड आकार : 221.76 MiB
डेटासेट का आकार : 274.83 MiB
विभाजन :

विभाजित करना	उदाहरण
`'train'`	10,154

उदाहरण ( tfds.as_dataframe ):

d4rl_antmaze/umaze-divers-v2

डाउनलोड आकार : 220.16 MiB
डेटासेट का आकार : 270.20 MiB
विभाजन :

विभाजित करना	उदाहरण
`'train'`	1,036

उदाहरण ( tfds.as_dataframe ):

d4rl_antmaze/मीडियम-प्ले-v2

डाउनलोड आकार : 220.40 MiB
डेटासेट का आकार : 275.22 MiB
विभाजन :

विभाजित करना	उदाहरण
`'train'`	10,768

उदाहरण ( tfds.as_dataframe ):

d4rl_antmaze/मध्यम-विविध-v2

डाउनलोड आकार : 220.39 MiB
डेटासेट का आकार : 271.19 MiB
विभाजन :

विभाजित करना	उदाहरण
`'train'`	2,959

उदाहरण ( tfds.as_dataframe ):

d4rl_antmaze/large-divers-v2

डाउनलोड आकार : 220.47 MiB
डेटासेट का आकार : 273.38 MiB
विभाजन :

विभाजित करना	उदाहरण
`'train'`	7,189

उदाहरण ( tfds.as_dataframe ):

d4rl_antmaze/large-play-v2

डाउनलोड आकार : 220.18 MiB
डेटासेट का आकार : 276.63 MiB
विभाजन :

विभाजित करना	उदाहरण
`'train'`	13,517

उदाहरण ( tfds.as_dataframe ):