aloha_mobile

  • תיאור :

מערך נתונים אמיתי. חיקוי משימות מניפולציה ניידות שהן דו-ידניות ודורשות שליטה על כל הגוף. 50 הדגמות לכל משימה.

לְפַצֵל דוגמאות
'train' 276
  • מבנה תכונה :
FeaturesDict({
    'episode_metadata': FeaturesDict({
        'file_path': string,
    }),
    'steps': Dataset({
        'action': Tensor(shape=(16,), dtype=float32),
        'discount': Scalar(shape=(), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'language_instruction': string,
        'observation': FeaturesDict({
            'cam_high': Image(shape=(480, 640, 3), dtype=uint8),
            'cam_left_wrist': Image(shape=(480, 640, 3), dtype=uint8),
            'cam_right_wrist': Image(shape=(480, 640, 3), dtype=uint8),
            'state': Tensor(shape=(14,), dtype=float32),
        }),
        'reward': Scalar(shape=(), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_metadata FeaturesDict
episode_metadata/file_path מוֹתֵחַ חוּט
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (16,) לצוף32
צעדים/הנחה סקלר לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
שלבים/הוראת_שפה מוֹתֵחַ חוּט
צעדים/תצפית FeaturesDict
צעדים/תצפית/מצלמת_גבוהה תמונה (480, 640, 3) uint8
צעדים/תצפית/מצלמת_יד_שמאל תמונה (480, 640, 3) uint8
צעדים/תצפית/מצלמת_יד_ימין תמונה (480, 640, 3) uint8
צעדים/תצפית/מצב מוֹתֵחַ (14,) לצוף32
צעדים/פרס סקלר לצוף32
  • ציטוט :
@inproceedings{fu2024mobile,author = {Fu, Zipeng and Zhao, Tony Z. and Finn, Chelsea},title = {Mobile ALOHA: Learning Bimanual Mobile Manipulation with Low-Cost Whole-Body Teleoperation},booktitle = {arXiv},year = {2024},}