- وصف :
فرانكا تستكشف مطابخ الألعاب
الصفحة الرئيسية : https://human-world-model.github.io/
كود المصدر :
tfds.robotics.rtx.CmuFrankaExplorationDatasetConvertedExternallyToRldsالإصدارات :
-
0.1.0(افتراضي): الإصدار الأولي.
-
حجم التحميل :
Unknown sizeحجم مجموعة البيانات :
602.24 MiBالتخزين المؤقت التلقائي ( الوثائق ): لا
الإنشقاقات :
| ينقسم | أمثلة |
|---|---|
'train' | 199 |
- هيكل الميزة :
FeaturesDict({
'episode_metadata': FeaturesDict({
'file_path': Text(shape=(), dtype=string),
}),
'steps': Dataset({
'action': Tensor(shape=(8,), dtype=float32, description=Robot action, consists of [end effector position3x, end effector orientation3x, gripper action1x, episode termination1x].),
'discount': Scalar(shape=(), dtype=float32, description=Discount if provided, default to 1.),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'language_embedding': Tensor(shape=(512,), dtype=float32, description=Kona language embedding. See https://tfhub.dev/google/universal-sentence-encoder-large/5),
'language_instruction': Text(shape=(), dtype=string),
'observation': FeaturesDict({
'highres_image': Image(shape=(480, 640, 3), dtype=uint8, description=High resolution main camera observation),
'image': Image(shape=(64, 64, 3), dtype=uint8, description=Main camera RGB observation.),
}),
'reward': Scalar(shape=(), dtype=float32, description=Reward if provided, 1 on final step for demos.),
'structured_action': Tensor(shape=(8,), dtype=float32, description=Structured action, consisting of hybrid affordance and end-effector control, described in Structured World Models from Human Videos.),
}),
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع D | وصف |
|---|---|---|---|---|
| المميزاتDict | ||||
| الحلقة_البيانات الوصفية | المميزاتDict | |||
| Episode_metadata/file_path | نص | خيط | المسار إلى ملف البيانات الأصلي. | |
| خطوات | مجموعة البيانات | |||
| الخطوات/الإجراء | الموتر | (8،) | float32 | يتكون عمل الروبوت من [موضع المستجيب النهائي 3x، اتجاه المستجيب النهائي 3x، عمل القابض 1x، إنهاء الحلقة 1x]. |
| الخطوات/الخصم | العددية | float32 | الخصم إذا تم توفيره، الافتراضي هو 1. | |
| الخطوات/is_first | الموتر | منطقي | ||
| الخطوات/is_last | الموتر | منطقي | ||
| الخطوات/is_terminal | الموتر | منطقي | ||
| الخطوات/language_embedding | الموتر | (512،) | float32 | تضمين لغة كونا. راجع https://tfhub.dev/google/universal-sentence-encoder-large/5 |
| الخطوات/language_instruction | نص | خيط | تعليم اللغة. | |
| الخطوات/الملاحظة | المميزاتDict | |||
| الخطوات/الملاحظة/highres_image | صورة | (480، 640، 3) | uint8 | مراقبة الكاميرا الرئيسية بدقة عالية |
| الخطوات/الملاحظة/الصورة | صورة | (64، 64، 3) | uint8 | مراقبة الكاميرا الرئيسية RGB. |
| خطوات/مكافأة | العددية | float32 | مكافأة إذا تم توفيرها، 1 في الخطوة النهائية للعروض التوضيحية. | |
| الخطوات/structured_action | الموتر | (8،) | float32 | العمل المنظم، الذي يتكون من القدرة الهجينة والتحكم في المؤثر النهائي، موصوف في نماذج العالم المنظمة من مقاطع الفيديو البشرية. |
المفاتيح الخاضعة للإشراف (انظر
as_superviseddoc ):Noneالشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@inproceedings{mendonca2023structured,
title={Structured World Models from Human Videos},
author={Mendonca, Russell and Bahl, Shikhar and Pathak, Deepak},
journal={RSS},
year={2023}
}