- opis :
Te zbiory danych zostały utworzone w środowisku PickPlaceCan symulatora ramienia robota robosuite . Zestawy danych ludzkich zostały zarejestrowane przez jednego operatora za pomocą RLDS Creator i kontrolera gamepada.
Syntetyczne zbiory danych zostały zarejestrowane przy użyciu biblioteki EnvLogger .
Zestawy danych są zgodne z formatem RLDS, aby reprezentować kroki i epizody.
Odcinki składają się z 400 kroków. W każdym odcinku po zakończeniu zadania dodawany jest tag, który jest przechowywany jako część niestandardowych metadanych kroku.
Należy pamiętać, że ze względu na zależność EnvLoggera generowanie tego zestawu danych jest obecnie obsługiwane tylko w środowiskach Linux.
Kod źródłowy :
tfds.rlds.robosuite_panda_pick_place_can.RobosuitePandaPickPlaceCan
Wersje :
-
1.0.0
(domyślnie): Wersja początkowa.
-
Automatyczne buforowanie ( dokumentacja ): Nie
Klucze nadzorowane (Zobacz dokument
as_supervised
):None
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Cytat :
@misc{ramos2021rlds,
title={RLDS: an Ecosystem to Generate, Share and Use Datasets in Reinforcement Learning},
author={Sabela Ramos and Sertan Girgin and Léonard Hussenot and Damien Vincent and Hanna Yakubovich and Daniel Toyama and Anita Gergely and Piotr Stanczyk and Raphael Marinier and Jeremiah Harmsen and Olivier Pietquin and Nikola Momchev},
year={2021},
eprint={2111.02767},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
robosuite_panda_pick_place_can/human_dc29b40a (domyślna konfiguracja)
Opis konfiguracji : zbiór danych wygenerowany przez człowieka (50 odcinków).
Strona główna : https://github.com/google-research/rlds
Rozmiar pliku do pobrania :
96.67 MiB
Rozmiar zestawu danych :
407.24 MiB
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 50 |
- Struktura funkcji :
FeaturesDict({
'agent_id': string,
'episode_id': string,
'episode_index': int32,
'steps': Dataset({
'action': Tensor(shape=(7,), dtype=float64),
'discount': float64,
'image': Image(shape=(None, None, 3), dtype=uint8),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'Can_pos': Tensor(shape=(3,), dtype=float64),
'Can_quat': Tensor(shape=(4,), dtype=float64),
'Can_to_robot0_eef_pos': Tensor(shape=(3,), dtype=float64),
'Can_to_robot0_eef_quat': Tensor(shape=(4,), dtype=float32),
'object-state': Tensor(shape=(14,), dtype=float64),
'robot0_eef_pos': Tensor(shape=(3,), dtype=float64),
'robot0_eef_quat': Tensor(shape=(4,), dtype=float64),
'robot0_gripper_qpos': Tensor(shape=(2,), dtype=float64),
'robot0_gripper_qvel': Tensor(shape=(2,), dtype=float64),
'robot0_joint_pos_cos': Tensor(shape=(7,), dtype=float64),
'robot0_joint_pos_sin': Tensor(shape=(7,), dtype=float64),
'robot0_joint_vel': Tensor(shape=(7,), dtype=float64),
'robot0_proprio-state': Tensor(shape=(32,), dtype=float64),
}),
'reward': float64,
'tag:placed': bool,
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
identyfikator_agenta | Napinacz | strunowy | ||
identyfikator_odcinka | Napinacz | strunowy | ||
indeks_odcinka | Napinacz | int32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (7,) | pływak64 | |
kroki/rabat | Napinacz | pływak64 | ||
kroki/obraz | Obraz | (Brak, Brak, 3) | uint8 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/Can_pos | Napinacz | (3,) | pływak64 | |
kroki/obserwacja/Can_quat | Napinacz | (4,) | pływak64 | |
kroki/obserwacja/Can_to_robot0_eef_pos | Napinacz | (3,) | pływak64 | |
kroki/obserwacja/Can_to_robot0_eef_quat | Napinacz | (4,) | pływak32 | |
kroki/obserwacja/stan obiektu | Napinacz | (14,) | pływak64 | |
kroki/obserwacja/robot0_eef_pos | Napinacz | (3,) | pływak64 | |
kroki/obserwacja/robot0_eef_quat | Napinacz | (4,) | pływak64 | |
kroki/obserwacja/robot0_gripper_qpos | Napinacz | (2,) | pływak64 | |
kroki/obserwacja/robot0_gripper_qvel | Napinacz | (2,) | pływak64 | |
kroki/obserwacja/robot0_joint_pos_cos | Napinacz | (7,) | pływak64 | |
kroki/obserwacja/robot0_joint_pos_sin | Napinacz | (7,) | pływak64 | |
kroki/obserwacja/robot0_joint_vel | Napinacz | (7,) | pływak64 | |
kroki/obserwacja/robot0_proprio-state | Napinacz | (32,) | pływak64 | |
kroki/nagroda | Napinacz | pływak64 | ||
kroki/znacznik: umieszczone | Napinacz | bool |
- Przykłady ( tfds.as_dataframe ):
robosuite_panda_pick_place_can/human_images_dc29b40a
Opis konfiguracji : zestaw danych wygenerowany przez człowieka, w tym obrazy z różnymi kątami kamery podczas obserwacji. Pamiętaj, że wygenerowanie może zająć trochę czasu.
Strona główna : https://www.tensorflow.org/datasets/catalog/robosuite_panda_pick_place_can
Rozmiar pliku do pobrania :
10.95 GiB
Rozmiar zestawu danych :
7.53 GiB
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 50 |
- Struktura funkcji :
FeaturesDict({
'agent_id': string,
'episode_id': string,
'episode_index': int32,
'steps': Dataset({
'action': Tensor(shape=(7,), dtype=float64),
'discount': float64,
'image': Image(shape=(None, None, 3), dtype=uint8),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'Can_pos': Tensor(shape=(3,), dtype=float64),
'Can_quat': Tensor(shape=(4,), dtype=float64),
'Can_to_robot0_eef_pos': Tensor(shape=(3,), dtype=float64),
'Can_to_robot0_eef_quat': Tensor(shape=(4,), dtype=float32),
'agentview_image': Image(shape=(256, 256, 3), dtype=uint8),
'birdview_image': Image(shape=(256, 256, 3), dtype=uint8),
'object-state': Tensor(shape=(14,), dtype=float64),
'robot0_eef_pos': Tensor(shape=(3,), dtype=float64),
'robot0_eef_quat': Tensor(shape=(4,), dtype=float64),
'robot0_eye_in_hand_image': Image(shape=(256, 256, 3), dtype=uint8),
'robot0_gripper_qpos': Tensor(shape=(2,), dtype=float64),
'robot0_gripper_qvel': Tensor(shape=(2,), dtype=float64),
'robot0_joint_pos_cos': Tensor(shape=(7,), dtype=float64),
'robot0_joint_pos_sin': Tensor(shape=(7,), dtype=float64),
'robot0_joint_vel': Tensor(shape=(7,), dtype=float64),
'robot0_proprio-state': Tensor(shape=(32,), dtype=float64),
'robot0_robotview_image': Image(shape=(256, 256, 3), dtype=uint8),
}),
'reward': float64,
'tag:placed': bool,
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
identyfikator_agenta | Napinacz | strunowy | ||
identyfikator_odcinka | Napinacz | strunowy | ||
indeks_odcinka | Napinacz | int32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (7,) | pływak64 | |
kroki/rabat | Napinacz | pływak64 | ||
kroki/obraz | Obraz | (Brak, Brak, 3) | uint8 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/Can_pos | Napinacz | (3,) | pływak64 | |
kroki/obserwacja/Can_quat | Napinacz | (4,) | pływak64 | |
kroki/obserwacja/Can_to_robot0_eef_pos | Napinacz | (3,) | pływak64 | |
kroki/obserwacja/Can_to_robot0_eef_quat | Napinacz | (4,) | pływak32 | |
kroki/obserwacja/agentview_image | Obraz | (256, 256, 3) | uint8 | |
kroki/obserwacja/widok z lotu ptaka | Obraz | (256, 256, 3) | uint8 | |
kroki/obserwacja/stan obiektu | Napinacz | (14,) | pływak64 | |
kroki/obserwacja/robot0_eef_pos | Napinacz | (3,) | pływak64 | |
kroki/obserwacja/robot0_eef_quat | Napinacz | (4,) | pływak64 | |
kroki/obserwacja/robot0_eye_in_hand_image | Obraz | (256, 256, 3) | uint8 | |
kroki/obserwacja/robot0_gripper_qpos | Napinacz | (2,) | pływak64 | |
kroki/obserwacja/robot0_gripper_qvel | Napinacz | (2,) | pływak64 | |
kroki/obserwacja/robot0_joint_pos_cos | Napinacz | (7,) | pływak64 | |
kroki/obserwacja/robot0_joint_pos_sin | Napinacz | (7,) | pływak64 | |
kroki/obserwacja/robot0_joint_vel | Napinacz | (7,) | pływak64 | |
kroki/obserwacja/robot0_proprio-state | Napinacz | (32,) | pływak64 | |
kroki/obserwacja/robot0_robotview_image | Obraz | (256, 256, 3) | uint8 | |
kroki/nagroda | Napinacz | pływak64 | ||
kroki/znacznik: umieszczone | Napinacz | bool |
- Przykłady ( tfds.as_dataframe ):
robosuite_panda_pick_place_can/synthetic_stochastic_sac_afe13968
Opis konfiguracji : Syntetyczny zestaw danych wygenerowany przez agenta stochastycznego przeszkolonego za pomocą SAC (200 odcinków).
Strona główna : https://github.com/google-research/rlds
Rozmiar pliku do pobrania :
144.44 MiB
Rozmiar zestawu danych :
622.86 MiB
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 200 |
- Struktura funkcji :
FeaturesDict({
'agent_id': string,
'episode_id': string,
'episode_index': int32,
'steps': Dataset({
'action': Tensor(shape=(7,), dtype=float32),
'discount': float64,
'image': Image(shape=(None, None, 3), dtype=uint8),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'Can_pos': Tensor(shape=(3,), dtype=float32),
'Can_quat': Tensor(shape=(4,), dtype=float32),
'Can_to_robot0_eef_pos': Tensor(shape=(3,), dtype=float32),
'Can_to_robot0_eef_quat': Tensor(shape=(4,), dtype=float32),
'object-state': Tensor(shape=(14,), dtype=float32),
'robot0_eef_pos': Tensor(shape=(3,), dtype=float32),
'robot0_eef_quat': Tensor(shape=(4,), dtype=float32),
'robot0_gripper_qpos': Tensor(shape=(2,), dtype=float32),
'robot0_gripper_qvel': Tensor(shape=(2,), dtype=float32),
'robot0_joint_pos_cos': Tensor(shape=(7,), dtype=float32),
'robot0_joint_pos_sin': Tensor(shape=(7,), dtype=float32),
'robot0_joint_vel': Tensor(shape=(7,), dtype=float32),
'robot0_proprio-state': Tensor(shape=(32,), dtype=float32),
}),
'reward': float64,
'tag:placed': bool,
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
identyfikator_agenta | Napinacz | strunowy | ||
identyfikator_odcinka | Napinacz | strunowy | ||
indeks_odcinka | Napinacz | int32 | ||
kroki | Zbiór danych | |||
kroki/działanie | Napinacz | (7,) | pływak32 | |
kroki/rabat | Napinacz | pływak64 | ||
kroki/obraz | Obraz | (Brak, Brak, 3) | uint8 | |
kroki/jest_pierwszy | Napinacz | bool | ||
kroki/jest_ostatni | Napinacz | bool | ||
kroki/jest_terminalem | Napinacz | bool | ||
kroki/obserwacja | FunkcjeDict | |||
kroki/obserwacja/Can_pos | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/Can_quat | Napinacz | (4,) | pływak32 | |
kroki/obserwacja/Can_to_robot0_eef_pos | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/Can_to_robot0_eef_quat | Napinacz | (4,) | pływak32 | |
kroki/obserwacja/stan obiektu | Napinacz | (14,) | pływak32 | |
kroki/obserwacja/robot0_eef_pos | Napinacz | (3,) | pływak32 | |
kroki/obserwacja/robot0_eef_quat | Napinacz | (4,) | pływak32 | |
kroki/obserwacja/robot0_gripper_qpos | Napinacz | (2,) | pływak32 | |
kroki/obserwacja/robot0_gripper_qvel | Napinacz | (2,) | pływak32 | |
kroki/obserwacja/robot0_joint_pos_cos | Napinacz | (7,) | pływak32 | |
kroki/obserwacja/robot0_joint_pos_sin | Napinacz | (7,) | pływak32 | |
kroki/obserwacja/robot0_joint_vel | Napinacz | (7,) | pływak32 | |
kroki/obserwacja/robot0_proprio-state | Napinacz | (32,) | pływak32 | |
kroki/nagroda | Napinacz | pływak64 | ||
kroki/znacznik: umieszczone | Napinacz | bool |
- Przykłady ( tfds.as_dataframe ):