iamlab_cmu_pickup_insert_converted_externally_to_rlds

 • Opis :

Franka wybiera przedmioty i zadania wstawiania

Podział Przykłady
'train' 631
 • Struktura funkcji :
FeaturesDict({
  'episode_metadata': FeaturesDict({
    'file_path': Text(shape=(), dtype=string),
  }),
  'steps': Dataset({
    'action': Tensor(shape=(8,), dtype=float32),
    'discount': Scalar(shape=(), dtype=float32),
    'is_first': bool,
    'is_last': bool,
    'is_terminal': bool,
    'language_embedding': Tensor(shape=(512,), dtype=float32),
    'language_instruction': Text(shape=(), dtype=string),
    'observation': FeaturesDict({
      'image': Image(shape=(360, 640, 3), dtype=uint8),
      'state': Tensor(shape=(20,), dtype=float32),
      'wrist_image': Image(shape=(240, 320, 3), dtype=uint8),
    }),
    'reward': Scalar(shape=(), dtype=float32),
  }),
})
 • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDykt
metadane_odcinka FunkcjeDykt
metadane_odcinka/ścieżka_pliku Tekst strunowy Ścieżka do oryginalnego pliku danych.
kroki Zbiór danych
kroki/akcja Napinacz (8,) pływak32 Działanie robota składa się z [3x pozycja efektora końcowego, 4x kwaternion efektora końcowego, 1x otwieranie/zamykanie chwytaka].
kroki/rabat Skalarny pływak32 Rabat, jeśli jest podany, domyślnie wynosi 1.
kroki/jest_pierwszy Napinacz bool
kroki/jest_ostatni Napinacz bool
kroki/is_terminal Napinacz bool
kroki/osadzanie_języka Napinacz (512,) pływak32 Osadzanie języka Kona. Zobacz https://tfhub.dev/google/universal-sentence-encoder-large/5
kroki/instrukcja_językowa Tekst strunowy Instrukcja językowa.
kroki/obserwacje FunkcjeDykt
kroki/obserwacja/obraz Obraz (360, 640, 3) uint8 Główna kamera obserwacji RGB.
kroki/obserwacja/stan Napinacz (20,) pływak32 Stan robota, składa się z [7x kątów przegubów robota, 1x stanu chwytaka, 6x momentów obrotowych połączeń, 6x siły efektora końcowego].
kroki/obserwacja/obraz_nadgarstka Obraz (240, 320, 3) uint8 Kamera nadgarstkowa do obserwacji RGB.
kroki/nagroda Skalarny pływak32 Nagroda, jeśli jest zapewniona, 1 na ostatnim etapie w przypadku wersji demonstracyjnych.
 • Cytat :
@inproceedings{
saxena2023multiresolution,
title={Multi-Resolution Sensing for Real-Time Control with Vision-Language Models},
author={Saumya Saxena and Mohit Sharma and Oliver Kroemer},
booktitle={7th Annual Conference on Robot Learning},
year={2023},
url={https://openreview.net/forum?id=WuBv9-IGDUA}
}