asu_table_top_converted_ex externally_to_rlds

  • विवरण :

UR5 टेबल-टॉप पिक/प्लेस/रोटेट कार्य निष्पादित कर रहा है

विभाजित करना उदाहरण
'train' 110
  • फ़ीचर संरचना :
FeaturesDict({
    'episode_metadata': FeaturesDict({
        'file_path': Text(shape=(), dtype=string),
    }),
    'steps': Dataset({
        'action': Tensor(shape=(7,), dtype=float32),
        'action_delta': Tensor(shape=(7,), dtype=float32),
        'action_inst': Text(shape=(), dtype=string),
        'discount': Scalar(shape=(), dtype=float32),
        'goal_object': Text(shape=(), dtype=string),
        'ground_truth_states': FeaturesDict({
            'EE': Tensor(shape=(6,), dtype=float32),
            'bottle': Tensor(shape=(6,), dtype=float32),
            'bread': Tensor(shape=(6,), dtype=float32),
            'coke': Tensor(shape=(6,), dtype=float32),
            'cube': Tensor(shape=(6,), dtype=float32),
            'milk': Tensor(shape=(6,), dtype=float32),
            'pepsi': Tensor(shape=(6,), dtype=float32),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'language_embedding': Tensor(shape=(512,), dtype=float32),
        'language_instruction': Text(shape=(), dtype=string),
        'observation': FeaturesDict({
            'image': Image(shape=(224, 224, 3), dtype=uint8),
            'state': Tensor(shape=(7,), dtype=float32),
            'state_vel': Tensor(shape=(7,), dtype=float32),
        }),
        'reward': Scalar(shape=(), dtype=float32),
    }),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीप्रकार विवरण
फीचर्सडिक्ट
एपिसोड_मेटाडेटा फीचर्सडिक्ट
एपिसोड_मेटाडेटा/फ़ाइल_पथ मूलपाठ डोरी मूल डेटा फ़ाइल का पथ.
कदम डेटासेट
कदम/कार्रवाई टेन्सर (7,) फ्लोट32 रोबोट कार्रवाई में [7x संयुक्त वेग, 2x ग्रिपर वेग, 1x टर्मिनेट एपिसोड] शामिल है।
चरण/कार्रवाई_डेल्टा टेन्सर (7,) फ्लोट32 रोबोट डेल्टा एक्शन में [7x संयुक्त वेग, 2x ग्रिपर वेग, 1x टर्मिनेट एपिसोड] शामिल है।
चरण/कार्रवाई_इंस्ट मूलपाठ डोरी क्रियान्वित किया जाना है.
कदम/छूट अदिश फ्लोट32 यदि छूट प्रदान की गई है, तो डिफ़ॉल्ट 1 है।
चरण/लक्ष्य_वस्तु मूलपाठ डोरी जिस वस्तु के साथ छेड़छाड़ की जानी है।
चरण/जमीनी सच्चाई_स्थितियां फीचर्सडिक्ट
चरण/ग्राउंड_ट्रुथ_स्टेट्स/ईई टेन्सर (6,) फ्लोट32 xyzrpy
चरण/ग्राउंड_ट्रुथ_स्टेट्स/बोतल टेन्सर (6,) फ्लोट32 xyzrpy
चरण/जमीनी सच्चाई_स्थिति/रोटी टेन्सर (6,) फ्लोट32 xyzrpy
चरण/ग्राउंड_ट्रुथ_स्टेट्स/कोक टेन्सर (6,) फ्लोट32 xyzrpy
चरण/ग्राउंड_ट्रुथ_स्टेट्स/क्यूब टेन्सर (6,) फ्लोट32 xyzrpy
चरण/जमीनी_सच्चाई_स्थिति/दूध टेन्सर (6,) फ्लोट32 xyzrpy
चरण/ग्राउंड_ट्रुथ_स्टेट्स/पेप्सी टेन्सर (6,) फ्लोट32 xyzrpy
चरण/पहला है टेन्सर बूल
चरण/अंतिम है टेन्सर बूल
चरण/is_terminal टेन्सर बूल
चरण/भाषा_एम्बेडिंग टेन्सर (512,) फ्लोट32 कोना भाषा एम्बेडिंग. https://tfhub.dev/google/universal-sentence-encoder-large/5 देखें
चरण/भाषा_निर्देश मूलपाठ डोरी भाषा निर्देश.
चरण/अवलोकन फीचर्सडिक्ट
चरण/अवलोकन/छवि छवि (224, 224, 3) uint8 मुख्य कैमरा आरजीबी अवलोकन।
चरण/अवलोकन/स्थिति टेन्सर (7,) फ्लोट32 रोबोट अवस्था में [6x रोबोट संयुक्त कोण, 1x ग्रिपर स्थिति] शामिल है।
चरण/अवलोकन/स्थिति_वेल टेन्सर (7,) फ्लोट32 रोबोट संयुक्त वेग, [6x रोबोट संयुक्त कोण, 1x ग्रिपर स्थिति] से युक्त होता है।
कदम/इनाम अदिश फ्लोट32 यदि प्रदान किया गया तो इनाम, डेमो के लिए अंतिम चरण पर 1।
  • उद्धरण :
@inproceedings{zhou2023modularity,
  title={Modularity through Attention: Efficient Training and Transfer of Language-Conditioned Policies for Robot Manipulation},
  author={Zhou, Yifan and Sonawani, Shubham and Phielipp, Mariano and Stepputtis, Simon and Amor, Heni},
  booktitle={Conference on Robot Learning},
  pages={1684--1695},
  year={2023},
  organization={PMLR}
}
@article{zhou2023learning,
  title={Learning modular language-conditioned robot policies through attention},
  author={Zhou, Yifan and Sonawani, Shubham and Phielipp, Mariano and Ben Amor, Heni and Stepputtis, Simon},
  journal={Autonomous Robots},
  pages={1--21},
  year={2023},
  publisher={Springer}
}