קוקה

  • תיאור :

משימות איסוף וסידור מחדש של פחים

לְפַצֵל דוגמאות
'train' 580,392
  • מבנה תכונה :
FeaturesDict({
    'steps': Dataset({
        'action': FeaturesDict({
            'base_displacement_vector': Tensor(shape=(2,), dtype=float32),
            'base_displacement_vertical_rotation': Tensor(shape=(1,), dtype=float32),
            'gripper_closedness_action': Tensor(shape=(1,), dtype=float32),
            'rotation_delta': Tensor(shape=(3,), dtype=float32),
            'terminate_episode': Tensor(shape=(3,), dtype=int32),
            'world_vector': Tensor(shape=(3,), dtype=float32),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'clip_function_input/base_pose_tool_reached': Tensor(shape=(7,), dtype=float32),
            'clip_function_input/workspace_bounds': Tensor(shape=(3, 3), dtype=float32),
            'gripper_closed': Tensor(shape=(1,), dtype=float32),
            'height_to_bottom': Tensor(shape=(1,), dtype=float32),
            'image': Image(shape=(512, 640, 3), dtype=uint8),
            'natural_language_embedding': Tensor(shape=(512,), dtype=float32),
            'natural_language_instruction': string,
            'task_id': Tensor(shape=(1,), dtype=float32),
        }),
        'reward': Scalar(shape=(), dtype=float32),
    }),
    'success': bool,
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
צעדים מערך נתונים
צעדים/פעולה FeaturesDict
steps/action/base_displacement_vector מוֹתֵחַ (2,) לצוף32
צעדים/פעולה/סיבוב_אנכי_בסיס מוֹתֵחַ (1,) לצוף32
צעדים/פעולה/פעולה_סגירה_גריפת מוֹתֵחַ (1,) לצוף32
steps/action/rotation_delta מוֹתֵחַ (3,) לצוף32
steps/action/terminate_episode מוֹתֵחַ (3,) int32
צעדים/פעולה/וקטור_עולם מוֹתֵחַ (3,) לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
צעדים/תצפית FeaturesDict
שלבים/תצפית/קליפ_פונקציית_קלט/כלי_בסיס_פוזה_הושג מוֹתֵחַ (7,) לצוף32
steps/observation/clip_function_input/workspace_bounds מוֹתֵחַ (3, 3) לצוף32
מדרגות/תצפית/גריפר_סגור מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/גובה_למטה מוֹתֵחַ (1,) לצוף32
צעדים/תצפית/תמונה תמונה (512, 640, 3) uint8
צעדים/תצפית/טבעת_שפה_טבעית מוֹתֵחַ (512,) לצוף32
שלבים/התבוננות/הוראת_שפה_טבעית מוֹתֵחַ חוּט
צעדים/תצפית/מזהה_משימה מוֹתֵחַ (1,) לצוף32
צעדים/פרס סקלר לצוף32
הַצלָחָה מוֹתֵחַ bool
  • ציטוט :
@article{kalashnikov2018qt,
  title={Qt-opt: Scalable deep reinforcement learning for vision-based robotic manipulation},
  author={Kalashnikov, Dmitry and Irpan, Alex and Pastor, Peter and Ibarz, Julian and Herzog, Alexander and Jang, Eric and Quillen, Deirdre and Holly, Ethan and Kalakrishnan, Mrinal and Vanhoucke, Vincent and others},
  journal={arXiv preprint arXiv:1806.10293},
  year={2018}
}