kaist_nonprehensile_converted_externally_to_rlds

  • বর্ণনা :

ফ্রাঙ্কা অগ্রহণযোগ্য বস্তুর কারসাজি করছে

বিভক্ত উদাহরণ
'train' 201
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_metadata': FeaturesDict({
        'file_path': Text(shape=(), dtype=string),
    }),
    'steps': Dataset({
        'action': Tensor(shape=(20,), dtype=float32),
        'discount': Scalar(shape=(), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'language_embedding': Tensor(shape=(512,), dtype=float32),
        'language_instruction': Text(shape=(), dtype=string),
        'observation': FeaturesDict({
            'image': Image(shape=(480, 640, 3), dtype=uint8),
            'partial_pointcloud': Tensor(shape=(512, 3), dtype=float32),
            'state': Tensor(shape=(21,), dtype=float32),
        }),
        'reward': Scalar(shape=(), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
episode_metadata ফিচারসডিক্ট
episode_metadata/file_path পাঠ্য স্ট্রিং মূল ডেটা ফাইলের পথ।
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (20,) float32 রোবট অ্যাকশনের মধ্যে রয়েছে [3x এন্ড-ইফেক্টর পজিশন রেসিডুয়াল, 3x এন্ড-ইফেক্টর এক্সিস-এঙ্গেল রেসিডুয়াল, 7x রোবট জয়েন্ট k_p গেইন কোফিসিয়েন্ট, 7x রোবট জয়েন্ট ড্যাম্পিং রেশিও কোফিসিয়েন্ট]। অ্যাকশনের অবশিষ্টাংশগুলি গ্লোবাল, অর্থাৎ বাম দিকে গুন করা হয় বর্তমান শেষ-প্রভাবক অবস্থার।
পদক্ষেপ/ছাড় স্কেলার float32 ডিসকাউন্ট দেওয়া হলে, ডিফল্ট 1.
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/ভাষা_এম্বেডিং টেনসর (512,) float32 কোন ভাষা এম্বেডিং. https://tfhub.dev/google/universal-sentence-encoder-large/5 দেখুন
পদক্ষেপ/ভাষা_নির্দেশ পাঠ্য স্ট্রিং ভাষার নির্দেশনা।
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/চিত্র ছবি (480, 640, 3) uint8 প্রধান ক্যামেরা আরজিবি পর্যবেক্ষণ।
পদক্ষেপ/পর্যবেক্ষণ/আংশিক_পয়েন্টক্লাউড টেনসর (512, 3) float32 আংশিক পয়েন্টক্লাউড পর্যবেক্ষণ
পদক্ষেপ/পর্যবেক্ষণ/রাষ্ট্র টেনসর (২১,) float32 রোবট স্টেট, [joint_states, end_efector_pose] নিয়ে গঠিত। জয়েন্ট স্টেটগুলি 14-মাত্রিক, [q_0, w_0, q_1, w_0, ...] এর ক্রম অনুসারে বিন্যাসিত। অন্য কথায়, যৌথ অবস্থান এবং বেগ পরস্পর বিভক্ত। শেষ ইফেক্টর ভঙ্গি হল 7-মাত্রিক, [পজিশন, কোয়াটারনিয়ন] এর ক্রম অনুসারে ফর্ম্যাট করা হয়েছে। কোয়াটারনিয়নটি (x,y,z,w) ক্রমে ফর্ম্যাট করা হয়েছে। গ্রিপারের দুই আঙ্গুলের মাঝখানে এন্ড-ইফেক্টর ভঙ্গি টুল ফ্রেমকে নির্দেশ করে।
পদক্ষেপ/পুরস্কার স্কেলার float32 প্রদান করা হলে পুরস্কার, ডেমোর জন্য চূড়ান্ত ধাপে 1।
  • উদ্ধৃতি :
@article{kimpre,
  title={Pre-and post-contact policy decomposition for non-prehensile manipulation with zero-shot sim-to-real transfer},
  author={Kim, Minchan and Han, Junhyek and Kim, Jaehyung and Kim, Beomjoon},
  booktitle={2023 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS)},
  year={2023},
  organization={IEEE}
}