robosuite_panda_pick_place_can

  • opis :

Te zbiory danych zostały utworzone w środowisku PickPlaceCan symulatora ramienia robota robosuite . Zestawy danych ludzkich zostały zarejestrowane przez jednego operatora za pomocą RLDS Creator i kontrolera gamepada.

Syntetyczne zbiory danych zostały zarejestrowane przy użyciu biblioteki EnvLogger .

Zestawy danych są zgodne z formatem RLDS, aby reprezentować kroki i epizody.

Odcinki składają się z 400 kroków. W każdym odcinku po zakończeniu zadania dodawany jest tag, który jest przechowywany jako część niestandardowych metadanych kroku.

Należy pamiętać, że ze względu na zależność EnvLoggera generowanie tego zestawu danych jest obecnie obsługiwane tylko w środowiskach Linux.

@misc{ramos2021rlds,
      title={RLDS: an Ecosystem to Generate, Share and Use Datasets in Reinforcement Learning},
      author={Sabela Ramos and Sertan Girgin and Léonard Hussenot and Damien Vincent and Hanna Yakubovich and Daniel Toyama and Anita Gergely and Piotr Stanczyk and Raphael Marinier and Jeremiah Harmsen and Olivier Pietquin and Nikola Momchev},
      year={2021},
      eprint={2111.02767},
      archivePrefix={arXiv},
      primaryClass={cs.LG}
}

robosuite_panda_pick_place_can/human_dc29b40a (domyślna konfiguracja)

  • Opis konfiguracji : zbiór danych wygenerowany przez człowieka (50 odcinków).

  • Strona główna : https://github.com/google-research/rlds

  • Rozmiar pliku do pobrania : 96.67 MiB

  • Rozmiar zestawu danych : 407.24 MiB

  • Podziały :

Rozdzielać Przykłady
'train' 50
  • Struktura funkcji :
FeaturesDict({
    'agent_id': string,
    'episode_id': string,
    'episode_index': int32,
    'steps': Dataset({
        'action': Tensor(shape=(7,), dtype=float64),
        'discount': float64,
        'image': Image(shape=(None, None, 3), dtype=uint8),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'Can_pos': Tensor(shape=(3,), dtype=float64),
            'Can_quat': Tensor(shape=(4,), dtype=float64),
            'Can_to_robot0_eef_pos': Tensor(shape=(3,), dtype=float64),
            'Can_to_robot0_eef_quat': Tensor(shape=(4,), dtype=float32),
            'object-state': Tensor(shape=(14,), dtype=float64),
            'robot0_eef_pos': Tensor(shape=(3,), dtype=float64),
            'robot0_eef_quat': Tensor(shape=(4,), dtype=float64),
            'robot0_gripper_qpos': Tensor(shape=(2,), dtype=float64),
            'robot0_gripper_qvel': Tensor(shape=(2,), dtype=float64),
            'robot0_joint_pos_cos': Tensor(shape=(7,), dtype=float64),
            'robot0_joint_pos_sin': Tensor(shape=(7,), dtype=float64),
            'robot0_joint_vel': Tensor(shape=(7,), dtype=float64),
            'robot0_proprio-state': Tensor(shape=(32,), dtype=float64),
        }),
        'reward': float64,
        'tag:placed': bool,
    }),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
identyfikator_agenta Napinacz strunowy
identyfikator_odcinka Napinacz strunowy
indeks_odcinka Napinacz int32
kroki Zbiór danych
kroki/działanie Napinacz (7,) pływak64
kroki/rabat Napinacz pływak64
kroki/obraz Obraz (Brak, Brak, 3) uint8
kroki/jest_pierwszy Napinacz bool
kroki/jest_ostatni Napinacz bool
kroki/jest_terminalem Napinacz bool
kroki/obserwacja FunkcjeDict
kroki/obserwacja/Can_pos Napinacz (3,) pływak64
kroki/obserwacja/Can_quat Napinacz (4,) pływak64
kroki/obserwacja/Can_to_robot0_eef_pos Napinacz (3,) pływak64
kroki/obserwacja/Can_to_robot0_eef_quat Napinacz (4,) pływak32
kroki/obserwacja/stan obiektu Napinacz (14,) pływak64
kroki/obserwacja/robot0_eef_pos Napinacz (3,) pływak64
kroki/obserwacja/robot0_eef_quat Napinacz (4,) pływak64
kroki/obserwacja/robot0_gripper_qpos Napinacz (2,) pływak64
kroki/obserwacja/robot0_gripper_qvel Napinacz (2,) pływak64
kroki/obserwacja/robot0_joint_pos_cos Napinacz (7,) pływak64
kroki/obserwacja/robot0_joint_pos_sin Napinacz (7,) pływak64
kroki/obserwacja/robot0_joint_vel Napinacz (7,) pływak64
kroki/obserwacja/robot0_proprio-state Napinacz (32,) pływak64
kroki/nagroda Napinacz pływak64
kroki/znacznik: umieszczone Napinacz bool

robosuite_panda_pick_place_can/human_images_dc29b40a

Rozdzielać Przykłady
'train' 50
  • Struktura funkcji :
FeaturesDict({
    'agent_id': string,
    'episode_id': string,
    'episode_index': int32,
    'steps': Dataset({
        'action': Tensor(shape=(7,), dtype=float64),
        'discount': float64,
        'image': Image(shape=(None, None, 3), dtype=uint8),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'Can_pos': Tensor(shape=(3,), dtype=float64),
            'Can_quat': Tensor(shape=(4,), dtype=float64),
            'Can_to_robot0_eef_pos': Tensor(shape=(3,), dtype=float64),
            'Can_to_robot0_eef_quat': Tensor(shape=(4,), dtype=float32),
            'agentview_image': Image(shape=(256, 256, 3), dtype=uint8),
            'birdview_image': Image(shape=(256, 256, 3), dtype=uint8),
            'object-state': Tensor(shape=(14,), dtype=float64),
            'robot0_eef_pos': Tensor(shape=(3,), dtype=float64),
            'robot0_eef_quat': Tensor(shape=(4,), dtype=float64),
            'robot0_eye_in_hand_image': Image(shape=(256, 256, 3), dtype=uint8),
            'robot0_gripper_qpos': Tensor(shape=(2,), dtype=float64),
            'robot0_gripper_qvel': Tensor(shape=(2,), dtype=float64),
            'robot0_joint_pos_cos': Tensor(shape=(7,), dtype=float64),
            'robot0_joint_pos_sin': Tensor(shape=(7,), dtype=float64),
            'robot0_joint_vel': Tensor(shape=(7,), dtype=float64),
            'robot0_proprio-state': Tensor(shape=(32,), dtype=float64),
            'robot0_robotview_image': Image(shape=(256, 256, 3), dtype=uint8),
        }),
        'reward': float64,
        'tag:placed': bool,
    }),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
identyfikator_agenta Napinacz strunowy
identyfikator_odcinka Napinacz strunowy
indeks_odcinka Napinacz int32
kroki Zbiór danych
kroki/działanie Napinacz (7,) pływak64
kroki/rabat Napinacz pływak64
kroki/obraz Obraz (Brak, Brak, 3) uint8
kroki/jest_pierwszy Napinacz bool
kroki/jest_ostatni Napinacz bool
kroki/jest_terminalem Napinacz bool
kroki/obserwacja FunkcjeDict
kroki/obserwacja/Can_pos Napinacz (3,) pływak64
kroki/obserwacja/Can_quat Napinacz (4,) pływak64
kroki/obserwacja/Can_to_robot0_eef_pos Napinacz (3,) pływak64
kroki/obserwacja/Can_to_robot0_eef_quat Napinacz (4,) pływak32
kroki/obserwacja/agentview_image Obraz (256, 256, 3) uint8
kroki/obserwacja/widok z lotu ptaka Obraz (256, 256, 3) uint8
kroki/obserwacja/stan obiektu Napinacz (14,) pływak64
kroki/obserwacja/robot0_eef_pos Napinacz (3,) pływak64
kroki/obserwacja/robot0_eef_quat Napinacz (4,) pływak64
kroki/obserwacja/robot0_eye_in_hand_image Obraz (256, 256, 3) uint8
kroki/obserwacja/robot0_gripper_qpos Napinacz (2,) pływak64
kroki/obserwacja/robot0_gripper_qvel Napinacz (2,) pływak64
kroki/obserwacja/robot0_joint_pos_cos Napinacz (7,) pływak64
kroki/obserwacja/robot0_joint_pos_sin Napinacz (7,) pływak64
kroki/obserwacja/robot0_joint_vel Napinacz (7,) pływak64
kroki/obserwacja/robot0_proprio-state Napinacz (32,) pływak64
kroki/obserwacja/robot0_robotview_image Obraz (256, 256, 3) uint8
kroki/nagroda Napinacz pływak64
kroki/znacznik: umieszczone Napinacz bool

robosuite_panda_pick_place_can/synthetic_stochastic_sac_afe13968

  • Opis konfiguracji : Syntetyczny zestaw danych wygenerowany przez agenta stochastycznego przeszkolonego za pomocą SAC (200 odcinków).

  • Strona główna : https://github.com/google-research/rlds

  • Rozmiar pliku do pobrania : 144.44 MiB

  • Rozmiar zestawu danych : 622.86 MiB

  • Podziały :

Rozdzielać Przykłady
'train' 200
  • Struktura funkcji :
FeaturesDict({
    'agent_id': string,
    'episode_id': string,
    'episode_index': int32,
    'steps': Dataset({
        'action': Tensor(shape=(7,), dtype=float32),
        'discount': float64,
        'image': Image(shape=(None, None, 3), dtype=uint8),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'Can_pos': Tensor(shape=(3,), dtype=float32),
            'Can_quat': Tensor(shape=(4,), dtype=float32),
            'Can_to_robot0_eef_pos': Tensor(shape=(3,), dtype=float32),
            'Can_to_robot0_eef_quat': Tensor(shape=(4,), dtype=float32),
            'object-state': Tensor(shape=(14,), dtype=float32),
            'robot0_eef_pos': Tensor(shape=(3,), dtype=float32),
            'robot0_eef_quat': Tensor(shape=(4,), dtype=float32),
            'robot0_gripper_qpos': Tensor(shape=(2,), dtype=float32),
            'robot0_gripper_qvel': Tensor(shape=(2,), dtype=float32),
            'robot0_joint_pos_cos': Tensor(shape=(7,), dtype=float32),
            'robot0_joint_pos_sin': Tensor(shape=(7,), dtype=float32),
            'robot0_joint_vel': Tensor(shape=(7,), dtype=float32),
            'robot0_proprio-state': Tensor(shape=(32,), dtype=float32),
        }),
        'reward': float64,
        'tag:placed': bool,
    }),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
identyfikator_agenta Napinacz strunowy
identyfikator_odcinka Napinacz strunowy
indeks_odcinka Napinacz int32
kroki Zbiór danych
kroki/działanie Napinacz (7,) pływak32
kroki/rabat Napinacz pływak64
kroki/obraz Obraz (Brak, Brak, 3) uint8
kroki/jest_pierwszy Napinacz bool
kroki/jest_ostatni Napinacz bool
kroki/jest_terminalem Napinacz bool
kroki/obserwacja FunkcjeDict
kroki/obserwacja/Can_pos Napinacz (3,) pływak32
kroki/obserwacja/Can_quat Napinacz (4,) pływak32
kroki/obserwacja/Can_to_robot0_eef_pos Napinacz (3,) pływak32
kroki/obserwacja/Can_to_robot0_eef_quat Napinacz (4,) pływak32
kroki/obserwacja/stan obiektu Napinacz (14,) pływak32
kroki/obserwacja/robot0_eef_pos Napinacz (3,) pływak32
kroki/obserwacja/robot0_eef_quat Napinacz (4,) pływak32
kroki/obserwacja/robot0_gripper_qpos Napinacz (2,) pływak32
kroki/obserwacja/robot0_gripper_qvel Napinacz (2,) pływak32
kroki/obserwacja/robot0_joint_pos_cos Napinacz (7,) pływak32
kroki/obserwacja/robot0_joint_pos_sin Napinacz (7,) pływak32
kroki/obserwacja/robot0_joint_vel Napinacz (7,) pływak32
kroki/obserwacja/robot0_proprio-state Napinacz (32,) pływak32
kroki/nagroda Napinacz pływak64
kroki/znacznik: umieszczone Napinacz bool