TFDS obsługuje teraz format Croissant 🥐 ! Przeczytaj dokumentację , aby dowiedzieć się więcej.

Ta strona została przetłumaczona przez Cloud Translation API.

rlu_rwrl

opis :

RL Unplugged to zestaw testów porównawczych do uczenia się ze wzmacnianiem w trybie offline. RL Unplugged został zaprojektowany z myślą o następujących kwestiach: aby ułatwić użytkowanie, zapewniamy zestawy danych z ujednoliconym interfejsem API, który ułatwia praktykowi pracę ze wszystkimi danymi w pakiecie po ustaleniu ogólnego potoku.

Zestawy danych są zgodne z formatem RLDS, aby reprezentować kroki i epizody.

Przykłady w zbiorze danych przedstawiają przejścia SAR przechowywane podczas uruchamiania agenta częściowo przeszkolonego online, jak opisano w https://arxiv.org/abs/1904.12901 Przestrzegamy formatu zestawu danych RLDS, jak określono w https://github.com/google-research /rlds#format zestawu danych

Publikujemy łącznie 40 zestawów danych dotyczących 8 zadań — bez połączonych wyzwań i łatwych połączonych wyzwań dotyczących zadań z masztem, chodzika, czworonogów i humanoidów. Każde zadanie zawiera 5 różnych rozmiarów zestawów danych, 1%, 5%, 20%, 40% i 100%. Należy zauważyć, że mniejszy zbiór danych nie gwarantuje, że będzie podzbiorem większych. Aby uzyskać szczegółowe informacje na temat sposobu wygenerowania zestawu danych, zapoznaj się z artykułem.

Strona główna : https://github.com/deepmind/deepmind-research/tree/master/rl_unplugged
Kod źródłowy : tfds.rl_unplugged.rlu_rwrl.RluRwrl
Wersje :
- 1.0.0 : Pierwsza wersja.
- 1.0.1 (domyślnie): naprawia błąd w zbiorze danych RLU RWRL polegający na tym, że w jednym z humanoidalnych zestawów danych występują zduplikowane identyfikatory odcinków.
Rozmiar pliku do pobrania : Unknown size
Klucze nadzorowane (Zobacz dokument as_supervised ): None
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Cytat :

@misc{gulcehre2020rl,
    title={RL Unplugged: Benchmarks for Offline Reinforcement Learning},
    author={Caglar Gulcehre and Ziyu Wang and Alexander Novikov and Tom Le Paine
        and  Sergio Gómez Colmenarejo and Konrad Zolna and Rishabh Agarwal and
        Josh Merel and Daniel Mankowitz and Cosmin Paduraru and Gabriel
        Dulac-Arnold and Jerry Li and Mohammad Norouzi and Matt Hoffman and
        Ofir Nachum and George Tucker and Nicolas Heess and Nando deFreitas},
    year={2020},
    eprint={2006.13888},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

rlu_rwrl/cartpole_swingup_combined_challenge_none_1_percent (domyślna konfiguracja)

Rozmiar zbioru danych : 172.43 KiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :

Rozdzielać	Przykłady
`'train'`	5

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(1,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/pozycja	Napinacz	(3,)	pływak32
kroki/obserwacja/prędkość	Napinacz	(2,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/cartpole_swingup_combined_challenge_none_5_percent

Rozmiar zbioru danych : 862.13 KiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :

Rozdzielać	Przykłady
`'train'`	25

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(1,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/pozycja	Napinacz	(3,)	pływak32
kroki/obserwacja/prędkość	Napinacz	(2,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/cartpole_swingup_combined_challenge_none_20_percent

Rozmiar zestawu danych : 3.37 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :

Rozdzielać	Przykłady
`'train'`	100

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(1,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/pozycja	Napinacz	(3,)	pływak32
kroki/obserwacja/prędkość	Napinacz	(2,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/cartpole_swingup_combined_challenge_none_40_percent

Rozmiar zestawu danych : 6.74 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :

Rozdzielać	Przykłady
`'train'`	200

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(1,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/pozycja	Napinacz	(3,)	pływak32
kroki/obserwacja/prędkość	Napinacz	(2,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/cartpole_swingup_combined_challenge_none_100_percent

Rozmiar zestawu danych : 16.84 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :

Rozdzielać	Przykłady
`'train'`	500

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(1,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/pozycja	Napinacz	(3,)	pływak32
kroki/obserwacja/prędkość	Napinacz	(2,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/quadruped_walk_combined_challenge_none_1_percent

Rozmiar zestawu danych : 1.77 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :

Rozdzielać	Przykłady
`'train'`	5

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(12,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/stan_egocentryczny	Napinacz	(44,)	pływak32
kroki/obserwacja/siła_moment obrotowy	Napinacz	(24,)	pływak32
kroki/obserwacja/imu	Napinacz	(6,)	pływak32
kroki/obserwacja/torso_upright	Napinacz	(1,)	pływak32
kroki/obserwacja/torso_velocity	Napinacz	(3,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/quadruped_walk_combined_challenge_none_5_percent

Rozmiar zestawu danych : 8.86 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :

Rozdzielać	Przykłady
`'train'`	25

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(12,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/stan_egocentryczny	Napinacz	(44,)	pływak32
kroki/obserwacja/siła_moment obrotowy	Napinacz	(24,)	pływak32
kroki/obserwacja/imu	Napinacz	(6,)	pływak32
kroki/obserwacja/torso_upright	Napinacz	(1,)	pływak32
kroki/obserwacja/torso_velocity	Napinacz	(3,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/quadruped_walk_combined_challenge_none_20_percent

Rozmiar zestawu danych : 35.46 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :

Rozdzielać	Przykłady
`'train'`	100

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(12,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/stan_egocentryczny	Napinacz	(44,)	pływak32
kroki/obserwacja/siła_moment obrotowy	Napinacz	(24,)	pływak32
kroki/obserwacja/imu	Napinacz	(6,)	pływak32
kroki/obserwacja/torso_upright	Napinacz	(1,)	pływak32
kroki/obserwacja/torso_velocity	Napinacz	(3,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/quadruped_walk_combined_challenge_none_40_percent

Rozmiar zestawu danych : 70.92 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :

Rozdzielać	Przykłady
`'train'`	200

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(12,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/stan_egocentryczny	Napinacz	(44,)	pływak32
kroki/obserwacja/siła_moment obrotowy	Napinacz	(24,)	pływak32
kroki/obserwacja/imu	Napinacz	(6,)	pływak32
kroki/obserwacja/torso_upright	Napinacz	(1,)	pływak32
kroki/obserwacja/torso_velocity	Napinacz	(3,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/quadruped_walk_combined_challenge_none_100_percent

Rozmiar zestawu danych : 177.29 MiB
Automatyczne buforowanie ( dokumentacja ): Tylko wtedy, gdy shuffle_files=False (pociąg)
Podziały :

Rozdzielać	Przykłady
`'train'`	500

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(12,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/stan_egocentryczny	Napinacz	(44,)	pływak32
kroki/obserwacja/siła_moment obrotowy	Napinacz	(24,)	pływak32
kroki/obserwacja/imu	Napinacz	(6,)	pływak32
kroki/obserwacja/torso_upright	Napinacz	(1,)	pływak32
kroki/obserwacja/torso_velocity	Napinacz	(3,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/walker_walk_combined_challenge_none_1_percent

Rozmiar zestawu danych : 6.27 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :

Rozdzielać	Przykłady
`'train'`	50

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(6,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/wysokość	Napinacz	(1,)	pływak32
kroki/obserwacja/kierunki	Napinacz	(14,)	pływak32
kroki/obserwacja/prędkość	Napinacz	(9,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/walker_walk_combined_challenge_none_5_percent

Rozmiar zestawu danych : 31.34 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :

Rozdzielać	Przykłady
`'train'`	250

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(6,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/wysokość	Napinacz	(1,)	pływak32
kroki/obserwacja/kierunki	Napinacz	(14,)	pływak32
kroki/obserwacja/prędkość	Napinacz	(9,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/walker_walk_combined_challenge_none_20_percent

Rozmiar zestawu danych : 125.37 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :

Rozdzielać	Przykłady
`'train'`	1000

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(6,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/wysokość	Napinacz	(1,)	pływak32
kroki/obserwacja/kierunki	Napinacz	(14,)	pływak32
kroki/obserwacja/prędkość	Napinacz	(9,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/walker_walk_combined_challenge_none_40_percent

Rozmiar zestawu danych : 250.75 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :

Rozdzielać	Przykłady
`'train'`	2000

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(6,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/wysokość	Napinacz	(1,)	pływak32
kroki/obserwacja/kierunki	Napinacz	(14,)	pływak32
kroki/obserwacja/prędkość	Napinacz	(9,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/walker_walk_combined_challenge_none_100_percent

Rozmiar zestawu danych : 626.86 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :

Rozdzielać	Przykłady
`'train'`	5000

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(6,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/wysokość	Napinacz	(1,)	pływak32
kroki/obserwacja/kierunki	Napinacz	(14,)	pływak32
kroki/obserwacja/prędkość	Napinacz	(9,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/humanoid_walk_combined_challenge_none_1_percent

Rozmiar zestawu danych : 69.40 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :

Rozdzielać	Przykłady
`'train'`	200

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(21,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/com_velocity	Napinacz	(3,)	pływak32
kroki/obserwacja/kończyny	Napinacz	(12,)	pływak32
kroki/obserwacja/wysokość_głowy	Napinacz	(1,)	pływak32
kroki/obserwacja/kąty_wspólne	Napinacz	(21,)	pływak32
kroki/obserwacja/torso_vertical	Napinacz	(3,)	pływak32
kroki/obserwacja/prędkość	Napinacz	(27,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/humanoid_walk_combined_challenge_none_5_percent

Rozmiar zestawu danych : 346.98 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :

Rozdzielać	Przykłady
`'train'`	1000

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(21,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/com_velocity	Napinacz	(3,)	pływak32
kroki/obserwacja/kończyny	Napinacz	(12,)	pływak32
kroki/obserwacja/wysokość_głowy	Napinacz	(1,)	pływak32
kroki/obserwacja/kąty_wspólne	Napinacz	(21,)	pływak32
kroki/obserwacja/torso_vertical	Napinacz	(3,)	pływak32
kroki/obserwacja/prędkość	Napinacz	(27,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/humanoid_walk_combined_challenge_none_20_percent

Rozmiar zestawu danych : 1.36 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :

Rozdzielać	Przykłady
`'train'`	4000

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(21,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/com_velocity	Napinacz	(3,)	pływak32
kroki/obserwacja/kończyny	Napinacz	(12,)	pływak32
kroki/obserwacja/wysokość_głowy	Napinacz	(1,)	pływak32
kroki/obserwacja/kąty_wspólne	Napinacz	(21,)	pływak32
kroki/obserwacja/torso_vertical	Napinacz	(3,)	pływak32
kroki/obserwacja/prędkość	Napinacz	(27,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/humanoid_walk_combined_challenge_none_40_percent

Rozmiar zestawu danych : 2.71 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :

Rozdzielać	Przykłady
`'train'`	8000

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(21,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/com_velocity	Napinacz	(3,)	pływak32
kroki/obserwacja/kończyny	Napinacz	(12,)	pływak32
kroki/obserwacja/wysokość_głowy	Napinacz	(1,)	pływak32
kroki/obserwacja/kąty_wspólne	Napinacz	(21,)	pływak32
kroki/obserwacja/torso_vertical	Napinacz	(3,)	pływak32
kroki/obserwacja/prędkość	Napinacz	(27,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/humanoid_walk_combined_challenge_none_100_percent

Rozmiar zestawu danych : 6.78 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :

Rozdzielać	Przykłady
`'train'`	20 000

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(21,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/com_velocity	Napinacz	(3,)	pływak32
kroki/obserwacja/kończyny	Napinacz	(12,)	pływak32
kroki/obserwacja/wysokość_głowy	Napinacz	(1,)	pływak32
kroki/obserwacja/kąty_wspólne	Napinacz	(21,)	pływak32
kroki/obserwacja/torso_vertical	Napinacz	(3,)	pływak32
kroki/obserwacja/prędkość	Napinacz	(27,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/cartpole_swingup_combined_challenge_easy_1_percent

Rozmiar zbioru danych : 369.84 KiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :

Rozdzielać	Przykłady
`'train'`	5

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(1,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/manekin-0	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-1	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-2	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-3	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-4	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-5	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-6	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-7	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-8	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-9	Napinacz	(1,)	pływak32
kroki/obserwacja/pozycja	Napinacz	(3,)	pływak32
kroki/obserwacja/prędkość	Napinacz	(2,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/cartpole_swingup_combined_challenge_easy_5_percent

Rozmiar zestawu danych : 1.81 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :

Rozdzielać	Przykłady
`'train'`	25

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(1,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/manekin-0	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-1	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-2	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-3	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-4	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-5	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-6	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-7	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-8	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-9	Napinacz	(1,)	pływak32
kroki/obserwacja/pozycja	Napinacz	(3,)	pływak32
kroki/obserwacja/prędkość	Napinacz	(2,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/cartpole_swingup_combined_challenge_easy_20_percent

Rozmiar zestawu danych : 7.22 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :

Rozdzielać	Przykłady
`'train'`	100

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(1,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/manekin-0	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-1	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-2	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-3	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-4	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-5	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-6	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-7	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-8	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-9	Napinacz	(1,)	pływak32
kroki/obserwacja/pozycja	Napinacz	(3,)	pływak32
kroki/obserwacja/prędkość	Napinacz	(2,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/cartpole_swingup_combined_challenge_easy_40_percent

Rozmiar zestawu danych : 14.45 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :

Rozdzielać	Przykłady
`'train'`	200

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(1,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/manekin-0	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-1	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-2	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-3	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-4	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-5	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-6	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-7	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-8	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-9	Napinacz	(1,)	pływak32
kroki/obserwacja/pozycja	Napinacz	(3,)	pływak32
kroki/obserwacja/prędkość	Napinacz	(2,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/cartpole_swingup_combined_challenge_easy_100_percent

Rozmiar zestawu danych : 36.12 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :

Rozdzielać	Przykłady
`'train'`	500

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(1,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/manekin-0	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-1	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-2	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-3	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-4	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-5	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-6	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-7	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-8	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-9	Napinacz	(1,)	pływak32
kroki/obserwacja/pozycja	Napinacz	(3,)	pływak32
kroki/obserwacja/prędkość	Napinacz	(2,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/quadruped_walk_combined_challenge_easy_1_percent

Rozmiar zestawu danych : 1.97 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :

Rozdzielać	Przykłady
`'train'`	5

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(12,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/manekin-0	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-1	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-2	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-3	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-4	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-5	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-6	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-7	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-8	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-9	Napinacz	(1,)	pływak32
kroki/obserwacja/stan_egocentryczny	Napinacz	(44,)	pływak32
kroki/obserwacja/siła_moment obrotowy	Napinacz	(24,)	pływak32
kroki/obserwacja/imu	Napinacz	(6,)	pływak32
kroki/obserwacja/torso_upright	Napinacz	(1,)	pływak32
kroki/obserwacja/torso_velocity	Napinacz	(3,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/quadruped_walk_combined_challenge_easy_5_percent

Rozmiar zestawu danych : 9.83 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :

Rozdzielać	Przykłady
`'train'`	25

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(12,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/manekin-0	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-1	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-2	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-3	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-4	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-5	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-6	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-7	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-8	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-9	Napinacz	(1,)	pływak32
kroki/obserwacja/stan_egocentryczny	Napinacz	(44,)	pływak32
kroki/obserwacja/siła_moment obrotowy	Napinacz	(24,)	pływak32
kroki/obserwacja/imu	Napinacz	(6,)	pływak32
kroki/obserwacja/torso_upright	Napinacz	(1,)	pływak32
kroki/obserwacja/torso_velocity	Napinacz	(3,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/quadruped_walk_combined_challenge_easy_20_percent

Rozmiar zestawu danych : 39.31 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :

Rozdzielać	Przykłady
`'train'`	100

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(12,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/manekin-0	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-1	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-2	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-3	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-4	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-5	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-6	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-7	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-8	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-9	Napinacz	(1,)	pływak32
kroki/obserwacja/stan_egocentryczny	Napinacz	(44,)	pływak32
kroki/obserwacja/siła_moment obrotowy	Napinacz	(24,)	pływak32
kroki/obserwacja/imu	Napinacz	(6,)	pływak32
kroki/obserwacja/torso_upright	Napinacz	(1,)	pływak32
kroki/obserwacja/torso_velocity	Napinacz	(3,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/quadruped_walk_combined_challenge_easy_40_percent

Rozmiar zestawu danych : 78.63 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :

Rozdzielać	Przykłady
`'train'`	200

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(12,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/manekin-0	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-1	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-2	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-3	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-4	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-5	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-6	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-7	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-8	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-9	Napinacz	(1,)	pływak32
kroki/obserwacja/stan_egocentryczny	Napinacz	(44,)	pływak32
kroki/obserwacja/siła_moment obrotowy	Napinacz	(24,)	pływak32
kroki/obserwacja/imu	Napinacz	(6,)	pływak32
kroki/obserwacja/torso_upright	Napinacz	(1,)	pływak32
kroki/obserwacja/torso_velocity	Napinacz	(3,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/quadruped_walk_combined_challenge_easy_100_percent

Rozmiar zestawu danych : 196.57 MiB
Automatyczne buforowanie ( dokumentacja ): Tylko wtedy, gdy shuffle_files=False (pociąg)
Podziały :

Rozdzielać	Przykłady
`'train'`	500

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(12,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/manekin-0	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-1	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-2	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-3	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-4	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-5	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-6	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-7	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-8	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-9	Napinacz	(1,)	pływak32
kroki/obserwacja/stan_egocentryczny	Napinacz	(44,)	pływak32
kroki/obserwacja/siła_moment obrotowy	Napinacz	(24,)	pływak32
kroki/obserwacja/imu	Napinacz	(6,)	pływak32
kroki/obserwacja/torso_upright	Napinacz	(1,)	pływak32
kroki/obserwacja/torso_velocity	Napinacz	(3,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/walker_walk_combined_challenge_easy_1_percent

Rozmiar zestawu danych : 8.20 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :

Rozdzielać	Przykłady
`'train'`	50

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(6,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/manekin-0	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-1	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-2	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-3	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-4	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-5	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-6	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-7	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-8	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-9	Napinacz	(1,)	pływak32
kroki/obserwacja/wysokość	Napinacz	(1,)	pływak32
kroki/obserwacja/kierunki	Napinacz	(14,)	pływak32
kroki/obserwacja/prędkość	Napinacz	(9,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/walker_walk_combined_challenge_easy_5_percent

Rozmiar zestawu danych : 40.98 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :

Rozdzielać	Przykłady
`'train'`	250

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(6,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/manekin-0	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-1	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-2	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-3	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-4	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-5	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-6	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-7	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-8	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-9	Napinacz	(1,)	pływak32
kroki/obserwacja/wysokość	Napinacz	(1,)	pływak32
kroki/obserwacja/kierunki	Napinacz	(14,)	pływak32
kroki/obserwacja/prędkość	Napinacz	(9,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/walker_walk_combined_challenge_easy_20_percent

Rozmiar zestawu danych : 163.93 MiB
Automatyczne buforowanie ( dokumentacja ): Tylko wtedy, gdy shuffle_files=False (pociąg)
Podziały :

Rozdzielać	Przykłady
`'train'`	1000

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(6,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/manekin-0	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-1	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-2	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-3	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-4	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-5	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-6	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-7	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-8	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-9	Napinacz	(1,)	pływak32
kroki/obserwacja/wysokość	Napinacz	(1,)	pływak32
kroki/obserwacja/kierunki	Napinacz	(14,)	pływak32
kroki/obserwacja/prędkość	Napinacz	(9,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/walker_walk_combined_challenge_easy_40_percent

Rozmiar zestawu danych : 327.86 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :

Rozdzielać	Przykłady
`'train'`	2000

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(6,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/manekin-0	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-1	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-2	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-3	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-4	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-5	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-6	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-7	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-8	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-9	Napinacz	(1,)	pływak32
kroki/obserwacja/wysokość	Napinacz	(1,)	pływak32
kroki/obserwacja/kierunki	Napinacz	(14,)	pływak32
kroki/obserwacja/prędkość	Napinacz	(9,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/walker_walk_combined_challenge_easy_100_percent

Rozmiar zestawu danych : 819.65 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :

Rozdzielać	Przykłady
`'train'`	5000

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(6,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/manekin-0	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-1	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-2	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-3	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-4	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-5	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-6	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-7	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-8	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-9	Napinacz	(1,)	pływak32
kroki/obserwacja/wysokość	Napinacz	(1,)	pływak32
kroki/obserwacja/kierunki	Napinacz	(14,)	pływak32
kroki/obserwacja/prędkość	Napinacz	(9,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/humanoid_walk_combined_challenge_easy_1_percent

Rozmiar zbioru danych : 77.11 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :

Rozdzielać	Przykłady
`'train'`	200

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(21,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/com_velocity	Napinacz	(3,)	pływak32
kroki/obserwacja/manekin-0	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-1	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-2	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-3	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-4	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-5	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-6	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-7	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-8	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-9	Napinacz	(1,)	pływak32
kroki/obserwacja/kończyny	Napinacz	(12,)	pływak32
kroki/obserwacja/wysokość_głowy	Napinacz	(1,)	pływak32
kroki/obserwacja/kąty_wspólne	Napinacz	(21,)	pływak32
kroki/obserwacja/torso_vertical	Napinacz	(3,)	pływak32
kroki/obserwacja/prędkość	Napinacz	(27,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/humanoid_walk_combined_challenge_easy_5_percent

Rozmiar zbioru danych : 385.54 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :

Rozdzielać	Przykłady
`'train'`	1000

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(21,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/com_velocity	Napinacz	(3,)	pływak32
kroki/obserwacja/manekin-0	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-1	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-2	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-3	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-4	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-5	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-6	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-7	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-8	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-9	Napinacz	(1,)	pływak32
kroki/obserwacja/kończyny	Napinacz	(12,)	pływak32
kroki/obserwacja/wysokość_głowy	Napinacz	(1,)	pływak32
kroki/obserwacja/kąty_wspólne	Napinacz	(21,)	pływak32
kroki/obserwacja/torso_vertical	Napinacz	(3,)	pływak32
kroki/obserwacja/prędkość	Napinacz	(27,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/humanoid_walk_combined_challenge_easy_20_percent

Rozmiar zestawu danych : 1.51 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :

Rozdzielać	Przykłady
`'train'`	4000

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(21,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/com_velocity	Napinacz	(3,)	pływak32
kroki/obserwacja/manekin-0	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-1	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-2	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-3	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-4	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-5	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-6	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-7	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-8	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-9	Napinacz	(1,)	pływak32
kroki/obserwacja/kończyny	Napinacz	(12,)	pływak32
kroki/obserwacja/wysokość_głowy	Napinacz	(1,)	pływak32
kroki/obserwacja/kąty_wspólne	Napinacz	(21,)	pływak32
kroki/obserwacja/torso_vertical	Napinacz	(3,)	pływak32
kroki/obserwacja/prędkość	Napinacz	(27,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/humanoid_walk_combined_challenge_easy_40_percent

Rozmiar zestawu danych : 3.01 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :

Rozdzielać	Przykłady
`'train'`	8000

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(21,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/com_velocity	Napinacz	(3,)	pływak32
kroki/obserwacja/manekin-0	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-1	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-2	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-3	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-4	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-5	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-6	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-7	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-8	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-9	Napinacz	(1,)	pływak32
kroki/obserwacja/kończyny	Napinacz	(12,)	pływak32
kroki/obserwacja/wysokość_głowy	Napinacz	(1,)	pływak32
kroki/obserwacja/kąty_wspólne	Napinacz	(21,)	pływak32
kroki/obserwacja/torso_vertical	Napinacz	(3,)	pływak32
kroki/obserwacja/prędkość	Napinacz	(27,)	pływak32
kroki/nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl/humanoid_walk_combined_challenge_easy_100_percent

Rozmiar zestawu danych : 7.53 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :

Rozdzielać	Przykłady
`'train'`	20 000

Struktura funkcji :

FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
odcinek_powrót	Napinacz		pływak32
kroki	Zbiór danych
kroki/działanie	Napinacz	(21,)	pływak32
kroki/rabat	Napinacz	(1,)	pływak32
kroki/jest_pierwszy	Napinacz		bool
kroki/jest_ostatni	Napinacz		bool
kroki/jest_terminalem	Napinacz		bool
kroki/obserwacja	FunkcjeDict
kroki/obserwacja/com_velocity	Napinacz	(3,)	pływak32
kroki/obserwacja/manekin-0	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-1	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-2	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-3	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-4	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-5	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-6	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-7	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-8	Napinacz	(1,)	pływak32
kroki/obserwacja/manekin-9	Napinacz	(1,)	pływak32
kroki/obserwacja/kończyny	Napinacz	(12,)	pływak32
kroki/obserwacja/wysokość_głowy	Napinacz	(1,)	pływak32
kroki/obserwacja/kąty_wspólne	Napinacz	(21,)	pływak32
kroki/obserwacja/torso_vertical	Napinacz	(3,)	pływak32
kroki/obserwacja/prędkość	Napinacz	(27,)	pływak32
kroki / nagroda	Napinacz	(1,)	pływak32

Przykłady ( tfds.as_dataframe ):

rlu_rwrl Zadbaj o dobrą organizację dzięki kolekcji Zapisuj i kategoryzuj treści zgodnie ze swoimi preferencjami.