rlu_rwrl

  • Mô tả :

RL Unplugged là bộ tiêu chuẩn cho việc học tăng cường ngoại tuyến. RL Unplugged được thiết kế dựa trên những cân nhắc sau: để tạo điều kiện thuận lợi cho việc sử dụng, chúng tôi cung cấp các bộ dữ liệu với một API thống nhất giúp người thực hành dễ dàng làm việc với tất cả dữ liệu trong bộ sau khi một quy trình chung đã được thiết lập.

Các bộ dữ liệu tuân theo định dạng RLDS để thể hiện các bước và giai đoạn.

Các ví dụ trong tập dữ liệu thể hiện các chuyển đổi SAR được lưu trữ khi chạy tác nhân được đào tạo một phần trực tuyến như được mô tả trong https://arxiv.org/abs/1904.12901 Chúng tôi tuân theo định dạng tập dữ liệu RLDS, như được chỉ định trong https://github.com/google-research /rlds#dataset-format

Chúng tôi phát hành tổng cộng 40 bộ dữ liệu cho 8 nhiệm vụ -- không có thử thách kết hợp và thử thách kết hợp dễ dàng đối với các nhiệm vụ xe đẩy, xe tập đi, bốn chân và hình người. Mỗi tác vụ chứa 5 kích cỡ khác nhau của bộ dữ liệu, 1%, 5%, 20%, 40% và 100%. Lưu ý rằng tập dữ liệu nhỏ hơn không được đảm bảo là tập con của tập dữ liệu lớn hơn. Để biết chi tiết về cách tạo bộ dữ liệu, vui lòng tham khảo bài viết.

@misc{gulcehre2020rl,
    title={RL Unplugged: Benchmarks for Offline Reinforcement Learning},
    author={Caglar Gulcehre and Ziyu Wang and Alexander Novikov and Tom Le Paine
        and  Sergio Gómez Colmenarejo and Konrad Zolna and Rishabh Agarwal and
        Josh Merel and Daniel Mankowitz and Cosmin Paduraru and Gabriel
        Dulac-Arnold and Jerry Li and Mohammad Norouzi and Matt Hoffman and
        Ofir Nachum and George Tucker and Nicolas Heess and Nando deFreitas},
    year={2020},
    eprint={2006.13888},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

rlu_rwrl/cartpole_swingup_combined_challenge_none_1_percent (cấu hình mặc định)

  • Kích thước tập dữ liệu : 172.43 KiB

  • Tự động lưu vào bộ đệm ( tài liệu ): Có

  • Chia tách :

Tách ra ví dụ
'train' 5
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (1,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
bước/quan sát/vị trí tenxơ (3,) phao32
bước/quan sát/vận tốc tenxơ (2,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/cartpole_swingup_combined_challenge_none_5_percent

  • Kích thước tập dữ liệu : 862.13 KiB

  • Tự động lưu vào bộ đệm ( tài liệu ): Có

  • Chia tách :

Tách ra ví dụ
'train' 25
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (1,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
bước/quan sát/vị trí tenxơ (3,) phao32
bước/quan sát/vận tốc tenxơ (2,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/cartpole_swingup_combined_challenge_none_20_percent

  • Kích thước tập dữ liệu : 3.37 MiB

  • Tự động lưu vào bộ đệm ( tài liệu ): Có

  • Chia tách :

Tách ra ví dụ
'train' 100
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (1,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
bước/quan sát/vị trí tenxơ (3,) phao32
bước/quan sát/vận tốc tenxơ (2,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/cartpole_swingup_combined_challenge_none_40_percent

  • Kích thước tập dữ liệu : 6.74 MiB

  • Tự động lưu vào bộ đệm ( tài liệu ): Có

  • Chia tách :

Tách ra ví dụ
'train' 200
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (1,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
bước/quan sát/vị trí tenxơ (3,) phao32
bước/quan sát/vận tốc tenxơ (2,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/cartpole_swingup_combined_challenge_none_100_percent

  • Kích thước tập dữ liệu : 16.84 MiB

  • Tự động lưu vào bộ đệm ( tài liệu ): Có

  • Chia tách :

Tách ra ví dụ
'train' 500
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (1,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
bước/quan sát/vị trí tenxơ (3,) phao32
bước/quan sát/vận tốc tenxơ (2,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/quadruped_walk_combined_challenge_none_1_percent

  • Kích thước tập dữ liệu : 1.77 MiB

  • Tự động lưu vào bộ đệm ( tài liệu ): Có

  • Chia tách :

Tách ra ví dụ
'train' 5
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (12,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
bước/quan sát/egocentric_state tenxơ (44,) phao32
các bước/quan sát/force_torque tenxơ (24,) phao32
các bước/quan sát/imu tenxơ (6,) phao32
bước/quan sát/torso_upright tenxơ (1,) phao32
bước/quan sát/torso_velocity tenxơ (3,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/quadruped_walk_combined_challenge_none_5_percent

  • Kích thước tập dữ liệu : 8.86 MiB

  • Tự động lưu vào bộ đệm ( tài liệu ): Có

  • Chia tách :

Tách ra ví dụ
'train' 25
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (12,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
bước/quan sát/egocentric_state tenxơ (44,) phao32
các bước/quan sát/force_torque tenxơ (24,) phao32
các bước/quan sát/imu tenxơ (6,) phao32
bước/quan sát/torso_upright tenxơ (1,) phao32
bước/quan sát/torso_velocity tenxơ (3,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/quadruped_walk_combined_challenge_none_20_percent

  • Kích thước tập dữ liệu : 35.46 MiB

  • Tự động lưu vào bộ đệm ( tài liệu ): Có

  • Chia tách :

Tách ra ví dụ
'train' 100
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (12,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
bước/quan sát/egocentric_state tenxơ (44,) phao32
các bước/quan sát/force_torque tenxơ (24,) phao32
các bước/quan sát/imu tenxơ (6,) phao32
bước/quan sát/torso_upright tenxơ (1,) phao32
bước/quan sát/torso_velocity tenxơ (3,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/quadruped_walk_combined_challenge_none_40_percent

  • Kích thước tập dữ liệu : 70.92 MiB

  • Tự động lưu vào bộ đệm ( tài liệu ): Có

  • Chia tách :

Tách ra ví dụ
'train' 200
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (12,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
bước/quan sát/egocentric_state tenxơ (44,) phao32
các bước/quan sát/force_torque tenxơ (24,) phao32
các bước/quan sát/imu tenxơ (6,) phao32
bước/quan sát/torso_upright tenxơ (1,) phao32
bước/quan sát/torso_velocity tenxơ (3,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/quadruped_walk_combined_challenge_none_100_percent

  • Kích thước tập dữ liệu : 177.29 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Chỉ khi shuffle_files=False (đào tạo)

  • Chia tách :

Tách ra ví dụ
'train' 500
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (12,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
bước/quan sát/egocentric_state tenxơ (44,) phao32
các bước/quan sát/force_torque tenxơ (24,) phao32
các bước/quan sát/imu tenxơ (6,) phao32
bước/quan sát/torso_upright tenxơ (1,) phao32
bước/quan sát/torso_velocity tenxơ (3,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/walker_walk_combined_challenge_none_1_percent

  • Kích thước tập dữ liệu : 6.27 MiB

  • Tự động lưu vào bộ đệm ( tài liệu ): Có

  • Chia tách :

Tách ra ví dụ
'train' 50
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (6,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
bước/quan sát/chiều cao tenxơ (1,) phao32
các bước/quan sát/định hướng tenxơ (14,) phao32
bước/quan sát/vận tốc tenxơ (9,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/walker_walk_combined_challenge_none_5_percent

  • Kích thước tập dữ liệu : 31.34 MiB

  • Tự động lưu vào bộ đệm ( tài liệu ): Có

  • Chia tách :

Tách ra ví dụ
'train' 250
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (6,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
bước/quan sát/chiều cao tenxơ (1,) phao32
các bước/quan sát/định hướng tenxơ (14,) phao32
bước/quan sát/vận tốc tenxơ (9,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/walker_walk_combined_challenge_none_20_percent

  • Kích thước tập dữ liệu : 125.37 MiB

  • Tự động lưu vào bộ đệm ( tài liệu ): Có

  • Chia tách :

Tách ra ví dụ
'train' 1.000
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (6,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
bước/quan sát/chiều cao tenxơ (1,) phao32
các bước/quan sát/định hướng tenxơ (14,) phao32
bước/quan sát/vận tốc tenxơ (9,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/walker_walk_combined_challenge_none_40_percent

  • Kích thước tập dữ liệu : 250.75 MiB

  • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

  • Chia tách :

Tách ra ví dụ
'train' 2.000
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (6,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
bước/quan sát/chiều cao tenxơ (1,) phao32
các bước/quan sát/định hướng tenxơ (14,) phao32
bước/quan sát/vận tốc tenxơ (9,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/walker_walk_combined_challenge_none_100_percent

  • Kích thước tập dữ liệu : 626.86 MiB

  • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

  • Chia tách :

Tách ra ví dụ
'train' 5.000
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (6,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
bước/quan sát/chiều cao tenxơ (1,) phao32
các bước/quan sát/định hướng tenxơ (14,) phao32
bước/quan sát/vận tốc tenxơ (9,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/humanoid_walk_combined_challenge_none_1_percent

  • Kích thước tập dữ liệu : 69.40 MiB

  • Tự động lưu vào bộ đệm ( tài liệu ): Có

  • Chia tách :

Tách ra ví dụ
'train' 200
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (21,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
bước/quan sát/com_velocity tenxơ (3,) phao32
bước / quan sát / chi tenxơ (12,) phao32
bước/quan sát/head_height tenxơ (1,) phao32
bước/quan sát/joint_angles tenxơ (21,) phao32
bước/quan sát/torso_vertical tenxơ (3,) phao32
bước/quan sát/vận tốc tenxơ (27,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/humanoid_walk_combined_challenge_none_5_percent

  • Kích thước tập dữ liệu : 346.98 MiB

  • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

  • Chia tách :

Tách ra ví dụ
'train' 1.000
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (21,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
bước/quan sát/com_velocity tenxơ (3,) phao32
bước / quan sát / chi tenxơ (12,) phao32
bước/quan sát/head_height tenxơ (1,) phao32
bước/quan sát/joint_angles tenxơ (21,) phao32
bước/quan sát/torso_vertical tenxơ (3,) phao32
bước/quan sát/vận tốc tenxơ (27,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/humanoid_walk_combined_challenge_none_20_percent

  • Kích thước tập dữ liệu : 1.36 GiB

  • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

  • Chia tách :

Tách ra ví dụ
'train' 4.000
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (21,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
bước/quan sát/com_velocity tenxơ (3,) phao32
bước / quan sát / chi tenxơ (12,) phao32
bước/quan sát/head_height tenxơ (1,) phao32
bước/quan sát/joint_angles tenxơ (21,) phao32
bước/quan sát/torso_vertical tenxơ (3,) phao32
bước/quan sát/vận tốc tenxơ (27,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/humanoid_walk_combined_challenge_none_40_percent

  • Kích thước tập dữ liệu : 2.71 GiB

  • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

  • Chia tách :

Tách ra ví dụ
'train' 8.000
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (21,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
bước/quan sát/com_velocity tenxơ (3,) phao32
bước / quan sát / chi tenxơ (12,) phao32
bước/quan sát/head_height tenxơ (1,) phao32
bước/quan sát/joint_angles tenxơ (21,) phao32
bước/quan sát/torso_vertical tenxơ (3,) phao32
bước/quan sát/vận tốc tenxơ (27,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/humanoid_walk_combined_challenge_none_100_percent

  • Kích thước tập dữ liệu : 6.78 GiB

  • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

  • Chia tách :

Tách ra ví dụ
'train' 20.000
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (21,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
bước/quan sát/com_velocity tenxơ (3,) phao32
bước / quan sát / chi tenxơ (12,) phao32
bước/quan sát/head_height tenxơ (1,) phao32
bước/quan sát/joint_angles tenxơ (21,) phao32
bước/quan sát/torso_vertical tenxơ (3,) phao32
bước/quan sát/vận tốc tenxơ (27,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_1_percent

  • Kích thước tập dữ liệu : 369.84 KiB

  • Tự động lưu vào bộ đệm ( tài liệu ): Có

  • Chia tách :

Tách ra ví dụ
'train' 5
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (1,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
các bước/quan sát/dummy-0 tenxơ (1,) phao32
các bước/quan sát/dummy-1 tenxơ (1,) phao32
các bước/quan sát/dummy-2 tenxơ (1,) phao32
các bước/quan sát/dummy-3 tenxơ (1,) phao32
bước/quan sát/dummy-4 tenxơ (1,) phao32
các bước/quan sát/dummy-5 tenxơ (1,) phao32
các bước/quan sát/dummy-6 tenxơ (1,) phao32
các bước/quan sát/dummy-7 tenxơ (1,) phao32
bước/quan sát/dummy-8 tenxơ (1,) phao32
các bước/quan sát/dummy-9 tenxơ (1,) phao32
bước/quan sát/vị trí tenxơ (3,) phao32
bước/quan sát/vận tốc tenxơ (2,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_5_percent

  • Kích thước tập dữ liệu : 1.81 MiB

  • Tự động lưu vào bộ đệm ( tài liệu ): Có

  • Chia tách :

Tách ra ví dụ
'train' 25
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (1,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
các bước/quan sát/dummy-0 tenxơ (1,) phao32
các bước/quan sát/dummy-1 tenxơ (1,) phao32
các bước/quan sát/dummy-2 tenxơ (1,) phao32
các bước/quan sát/dummy-3 tenxơ (1,) phao32
bước/quan sát/dummy-4 tenxơ (1,) phao32
các bước/quan sát/dummy-5 tenxơ (1,) phao32
các bước/quan sát/dummy-6 tenxơ (1,) phao32
các bước/quan sát/dummy-7 tenxơ (1,) phao32
bước/quan sát/dummy-8 tenxơ (1,) phao32
các bước/quan sát/dummy-9 tenxơ (1,) phao32
bước/quan sát/vị trí tenxơ (3,) phao32
bước/quan sát/vận tốc tenxơ (2,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_20_percent

  • Kích thước tập dữ liệu : 7.22 MiB

  • Tự động lưu vào bộ đệm ( tài liệu ): Có

  • Chia tách :

Tách ra ví dụ
'train' 100
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (1,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
các bước/quan sát/dummy-0 tenxơ (1,) phao32
các bước/quan sát/dummy-1 tenxơ (1,) phao32
các bước/quan sát/dummy-2 tenxơ (1,) phao32
các bước/quan sát/dummy-3 tenxơ (1,) phao32
bước/quan sát/dummy-4 tenxơ (1,) phao32
các bước/quan sát/dummy-5 tenxơ (1,) phao32
các bước/quan sát/dummy-6 tenxơ (1,) phao32
các bước/quan sát/dummy-7 tenxơ (1,) phao32
bước/quan sát/dummy-8 tenxơ (1,) phao32
các bước/quan sát/dummy-9 tenxơ (1,) phao32
bước/quan sát/vị trí tenxơ (3,) phao32
bước/quan sát/vận tốc tenxơ (2,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_40_percent

  • Kích thước tập dữ liệu : 14.45 MiB

  • Tự động lưu vào bộ đệm ( tài liệu ): Có

  • Chia tách :

Tách ra ví dụ
'train' 200
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (1,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
các bước/quan sát/dummy-0 tenxơ (1,) phao32
các bước/quan sát/dummy-1 tenxơ (1,) phao32
các bước/quan sát/dummy-2 tenxơ (1,) phao32
các bước/quan sát/dummy-3 tenxơ (1,) phao32
bước/quan sát/dummy-4 tenxơ (1,) phao32
các bước/quan sát/dummy-5 tenxơ (1,) phao32
các bước/quan sát/dummy-6 tenxơ (1,) phao32
các bước/quan sát/dummy-7 tenxơ (1,) phao32
bước/quan sát/dummy-8 tenxơ (1,) phao32
các bước/quan sát/dummy-9 tenxơ (1,) phao32
bước/quan sát/vị trí tenxơ (3,) phao32
bước/quan sát/vận tốc tenxơ (2,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_100_percent

  • Kích thước tập dữ liệu : 36.12 MiB

  • Tự động lưu vào bộ đệm ( tài liệu ): Có

  • Chia tách :

Tách ra ví dụ
'train' 500
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (1,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
các bước/quan sát/dummy-0 tenxơ (1,) phao32
các bước/quan sát/dummy-1 tenxơ (1,) phao32
các bước/quan sát/dummy-2 tenxơ (1,) phao32
các bước/quan sát/dummy-3 tenxơ (1,) phao32
bước/quan sát/dummy-4 tenxơ (1,) phao32
các bước/quan sát/dummy-5 tenxơ (1,) phao32
các bước/quan sát/dummy-6 tenxơ (1,) phao32
các bước/quan sát/dummy-7 tenxơ (1,) phao32
bước/quan sát/dummy-8 tenxơ (1,) phao32
các bước/quan sát/dummy-9 tenxơ (1,) phao32
bước/quan sát/vị trí tenxơ (3,) phao32
bước/quan sát/vận tốc tenxơ (2,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/quadruped_walk_combined_challenge_easy_1_percent

  • Kích thước tập dữ liệu : 1.97 MiB

  • Tự động lưu vào bộ đệm ( tài liệu ): Có

  • Chia tách :

Tách ra ví dụ
'train' 5
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (12,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
các bước/quan sát/dummy-0 tenxơ (1,) phao32
các bước/quan sát/dummy-1 tenxơ (1,) phao32
các bước/quan sát/dummy-2 tenxơ (1,) phao32
các bước/quan sát/dummy-3 tenxơ (1,) phao32
bước/quan sát/dummy-4 tenxơ (1,) phao32
các bước/quan sát/dummy-5 tenxơ (1,) phao32
các bước/quan sát/dummy-6 tenxơ (1,) phao32
các bước/quan sát/dummy-7 tenxơ (1,) phao32
bước/quan sát/dummy-8 tenxơ (1,) phao32
các bước/quan sát/dummy-9 tenxơ (1,) phao32
bước/quan sát/egocentric_state tenxơ (44,) phao32
các bước/quan sát/force_torque tenxơ (24,) phao32
các bước/quan sát/imu tenxơ (6,) phao32
bước/quan sát/torso_upright tenxơ (1,) phao32
bước/quan sát/torso_velocity tenxơ (3,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/quadruped_walk_combined_challenge_easy_5_percent

  • Kích thước tập dữ liệu : 9.83 MiB

  • Tự động lưu vào bộ đệm ( tài liệu ): Có

  • Chia tách :

Tách ra ví dụ
'train' 25
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (12,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
các bước/quan sát/dummy-0 tenxơ (1,) phao32
các bước/quan sát/dummy-1 tenxơ (1,) phao32
các bước/quan sát/dummy-2 tenxơ (1,) phao32
các bước/quan sát/dummy-3 tenxơ (1,) phao32
bước/quan sát/dummy-4 tenxơ (1,) phao32
các bước/quan sát/dummy-5 tenxơ (1,) phao32
các bước/quan sát/dummy-6 tenxơ (1,) phao32
các bước/quan sát/dummy-7 tenxơ (1,) phao32
bước/quan sát/dummy-8 tenxơ (1,) phao32
các bước/quan sát/dummy-9 tenxơ (1,) phao32
bước/quan sát/egocentric_state tenxơ (44,) phao32
các bước/quan sát/force_torque tenxơ (24,) phao32
các bước/quan sát/imu tenxơ (6,) phao32
bước/quan sát/torso_upright tenxơ (1,) phao32
bước/quan sát/torso_velocity tenxơ (3,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/quadruped_walk_combined_challenge_easy_20_percent

  • Kích thước tập dữ liệu : 39.31 MiB

  • Tự động lưu vào bộ đệm ( tài liệu ): Có

  • Chia tách :

Tách ra ví dụ
'train' 100
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (12,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
các bước/quan sát/dummy-0 tenxơ (1,) phao32
các bước/quan sát/dummy-1 tenxơ (1,) phao32
các bước/quan sát/dummy-2 tenxơ (1,) phao32
các bước/quan sát/dummy-3 tenxơ (1,) phao32
bước/quan sát/dummy-4 tenxơ (1,) phao32
các bước/quan sát/dummy-5 tenxơ (1,) phao32
các bước/quan sát/dummy-6 tenxơ (1,) phao32
các bước/quan sát/dummy-7 tenxơ (1,) phao32
bước/quan sát/dummy-8 tenxơ (1,) phao32
các bước/quan sát/dummy-9 tenxơ (1,) phao32
bước/quan sát/egocentric_state tenxơ (44,) phao32
các bước/quan sát/force_torque tenxơ (24,) phao32
các bước/quan sát/imu tenxơ (6,) phao32
bước/quan sát/torso_upright tenxơ (1,) phao32
bước/quan sát/torso_velocity tenxơ (3,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/quadruped_walk_combined_challenge_easy_40_percent

  • Kích thước tập dữ liệu : 78.63 MiB

  • Tự động lưu vào bộ đệm ( tài liệu ): Có

  • Chia tách :

Tách ra ví dụ
'train' 200
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (12,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
các bước/quan sát/dummy-0 tenxơ (1,) phao32
các bước/quan sát/dummy-1 tenxơ (1,) phao32
các bước/quan sát/dummy-2 tenxơ (1,) phao32
các bước/quan sát/dummy-3 tenxơ (1,) phao32
bước/quan sát/dummy-4 tenxơ (1,) phao32
các bước/quan sát/dummy-5 tenxơ (1,) phao32
các bước/quan sát/dummy-6 tenxơ (1,) phao32
các bước/quan sát/dummy-7 tenxơ (1,) phao32
bước/quan sát/dummy-8 tenxơ (1,) phao32
các bước/quan sát/dummy-9 tenxơ (1,) phao32
bước/quan sát/egocentric_state tenxơ (44,) phao32
các bước/quan sát/force_torque tenxơ (24,) phao32
các bước/quan sát/imu tenxơ (6,) phao32
bước/quan sát/torso_upright tenxơ (1,) phao32
bước/quan sát/torso_velocity tenxơ (3,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/quadruped_walk_combined_challenge_easy_100_percent

  • Kích thước tập dữ liệu : 196.57 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Chỉ khi shuffle_files=False (đào tạo)

  • Chia tách :

Tách ra ví dụ
'train' 500
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (12,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
các bước/quan sát/dummy-0 tenxơ (1,) phao32
các bước/quan sát/dummy-1 tenxơ (1,) phao32
các bước/quan sát/dummy-2 tenxơ (1,) phao32
các bước/quan sát/dummy-3 tenxơ (1,) phao32
bước/quan sát/dummy-4 tenxơ (1,) phao32
các bước/quan sát/dummy-5 tenxơ (1,) phao32
các bước/quan sát/dummy-6 tenxơ (1,) phao32
các bước/quan sát/dummy-7 tenxơ (1,) phao32
bước/quan sát/dummy-8 tenxơ (1,) phao32
các bước/quan sát/dummy-9 tenxơ (1,) phao32
bước/quan sát/egocentric_state tenxơ (44,) phao32
các bước/quan sát/force_torque tenxơ (24,) phao32
các bước/quan sát/imu tenxơ (6,) phao32
bước/quan sát/torso_upright tenxơ (1,) phao32
bước/quan sát/torso_velocity tenxơ (3,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/walker_walk_combined_challenge_easy_1_percent

  • Kích thước tập dữ liệu : 8.20 MiB

  • Tự động lưu vào bộ đệm ( tài liệu ): Có

  • Chia tách :

Tách ra ví dụ
'train' 50
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (6,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
các bước/quan sát/dummy-0 tenxơ (1,) phao32
các bước/quan sát/dummy-1 tenxơ (1,) phao32
các bước/quan sát/dummy-2 tenxơ (1,) phao32
các bước/quan sát/dummy-3 tenxơ (1,) phao32
bước/quan sát/dummy-4 tenxơ (1,) phao32
các bước/quan sát/dummy-5 tenxơ (1,) phao32
các bước/quan sát/dummy-6 tenxơ (1,) phao32
các bước/quan sát/dummy-7 tenxơ (1,) phao32
bước/quan sát/dummy-8 tenxơ (1,) phao32
các bước/quan sát/dummy-9 tenxơ (1,) phao32
bước/quan sát/chiều cao tenxơ (1,) phao32
các bước/quan sát/định hướng tenxơ (14,) phao32
bước/quan sát/vận tốc tenxơ (9,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/walker_walk_combined_challenge_easy_5_percent

  • Kích thước tập dữ liệu : 40.98 MiB

  • Tự động lưu vào bộ đệm ( tài liệu ): Có

  • Chia tách :

Tách ra ví dụ
'train' 250
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (6,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
các bước/quan sát/dummy-0 tenxơ (1,) phao32
các bước/quan sát/dummy-1 tenxơ (1,) phao32
các bước/quan sát/dummy-2 tenxơ (1,) phao32
các bước/quan sát/dummy-3 tenxơ (1,) phao32
bước/quan sát/dummy-4 tenxơ (1,) phao32
các bước/quan sát/dummy-5 tenxơ (1,) phao32
các bước/quan sát/dummy-6 tenxơ (1,) phao32
các bước/quan sát/dummy-7 tenxơ (1,) phao32
bước/quan sát/dummy-8 tenxơ (1,) phao32
các bước/quan sát/dummy-9 tenxơ (1,) phao32
bước/quan sát/chiều cao tenxơ (1,) phao32
các bước/quan sát/định hướng tenxơ (14,) phao32
bước/quan sát/vận tốc tenxơ (9,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/walker_walk_combined_challenge_easy_20_percent

  • Kích thước tập dữ liệu : 163.93 MiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Chỉ khi shuffle_files=False (đào tạo)

  • Chia tách :

Tách ra ví dụ
'train' 1.000
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (6,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
các bước/quan sát/dummy-0 tenxơ (1,) phao32
các bước/quan sát/dummy-1 tenxơ (1,) phao32
các bước/quan sát/dummy-2 tenxơ (1,) phao32
các bước/quan sát/dummy-3 tenxơ (1,) phao32
bước/quan sát/dummy-4 tenxơ (1,) phao32
các bước/quan sát/dummy-5 tenxơ (1,) phao32
các bước/quan sát/dummy-6 tenxơ (1,) phao32
các bước/quan sát/dummy-7 tenxơ (1,) phao32
bước/quan sát/dummy-8 tenxơ (1,) phao32
các bước/quan sát/dummy-9 tenxơ (1,) phao32
bước/quan sát/chiều cao tenxơ (1,) phao32
các bước/quan sát/định hướng tenxơ (14,) phao32
bước/quan sát/vận tốc tenxơ (9,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/walker_walk_combined_challenge_easy_40_percent

  • Kích thước tập dữ liệu : 327.86 MiB

  • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

  • Chia tách :

Tách ra ví dụ
'train' 2.000
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (6,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
các bước/quan sát/dummy-0 tenxơ (1,) phao32
các bước/quan sát/dummy-1 tenxơ (1,) phao32
các bước/quan sát/dummy-2 tenxơ (1,) phao32
các bước/quan sát/dummy-3 tenxơ (1,) phao32
bước/quan sát/dummy-4 tenxơ (1,) phao32
các bước/quan sát/dummy-5 tenxơ (1,) phao32
các bước/quan sát/dummy-6 tenxơ (1,) phao32
các bước/quan sát/dummy-7 tenxơ (1,) phao32
bước/quan sát/dummy-8 tenxơ (1,) phao32
các bước/quan sát/dummy-9 tenxơ (1,) phao32
bước/quan sát/chiều cao tenxơ (1,) phao32
các bước/quan sát/định hướng tenxơ (14,) phao32
bước/quan sát/vận tốc tenxơ (9,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/walker_walk_combined_challenge_easy_100_percent

  • Kích thước tập dữ liệu : 819.65 MiB

  • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

  • Chia tách :

Tách ra ví dụ
'train' 5.000
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (6,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
các bước/quan sát/dummy-0 tenxơ (1,) phao32
các bước/quan sát/dummy-1 tenxơ (1,) phao32
các bước/quan sát/dummy-2 tenxơ (1,) phao32
các bước/quan sát/dummy-3 tenxơ (1,) phao32
bước/quan sát/dummy-4 tenxơ (1,) phao32
các bước/quan sát/dummy-5 tenxơ (1,) phao32
các bước/quan sát/dummy-6 tenxơ (1,) phao32
các bước/quan sát/dummy-7 tenxơ (1,) phao32
bước/quan sát/dummy-8 tenxơ (1,) phao32
các bước/quan sát/dummy-9 tenxơ (1,) phao32
bước/quan sát/chiều cao tenxơ (1,) phao32
các bước/quan sát/định hướng tenxơ (14,) phao32
bước/quan sát/vận tốc tenxơ (9,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/humanoid_walk_combined_challenge_easy_1_percent

  • Kích thước tập dữ liệu : 77.11 MiB

  • Tự động lưu vào bộ đệm ( tài liệu ): Có

  • Chia tách :

Tách ra ví dụ
'train' 200
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (21,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
bước/quan sát/com_velocity tenxơ (3,) phao32
các bước/quan sát/dummy-0 tenxơ (1,) phao32
các bước/quan sát/dummy-1 tenxơ (1,) phao32
các bước/quan sát/dummy-2 tenxơ (1,) phao32
các bước/quan sát/dummy-3 tenxơ (1,) phao32
bước/quan sát/dummy-4 tenxơ (1,) phao32
các bước/quan sát/dummy-5 tenxơ (1,) phao32
các bước/quan sát/dummy-6 tenxơ (1,) phao32
các bước/quan sát/dummy-7 tenxơ (1,) phao32
bước/quan sát/dummy-8 tenxơ (1,) phao32
các bước/quan sát/dummy-9 tenxơ (1,) phao32
bước / quan sát / chi tenxơ (12,) phao32
bước/quan sát/head_height tenxơ (1,) phao32
bước/quan sát/joint_angles tenxơ (21,) phao32
bước/quan sát/torso_vertical tenxơ (3,) phao32
bước/quan sát/vận tốc tenxơ (27,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/humanoid_walk_combined_challenge_easy_5_percent

  • Kích thước tập dữ liệu : 385.54 MiB

  • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

  • Chia tách :

Tách ra ví dụ
'train' 1.000
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (21,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
bước/quan sát/com_velocity tenxơ (3,) phao32
các bước/quan sát/dummy-0 tenxơ (1,) phao32
các bước/quan sát/dummy-1 tenxơ (1,) phao32
các bước/quan sát/dummy-2 tenxơ (1,) phao32
các bước/quan sát/dummy-3 tenxơ (1,) phao32
bước/quan sát/dummy-4 tenxơ (1,) phao32
các bước/quan sát/dummy-5 tenxơ (1,) phao32
các bước/quan sát/dummy-6 tenxơ (1,) phao32
các bước/quan sát/dummy-7 tenxơ (1,) phao32
bước/quan sát/dummy-8 tenxơ (1,) phao32
các bước/quan sát/dummy-9 tenxơ (1,) phao32
bước / quan sát / chi tenxơ (12,) phao32
bước/quan sát/head_height tenxơ (1,) phao32
bước/quan sát/joint_angles tenxơ (21,) phao32
bước/quan sát/torso_vertical tenxơ (3,) phao32
bước/quan sát/vận tốc tenxơ (27,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/humanoid_walk_combined_challenge_easy_20_percent

  • Kích thước tập dữ liệu : 1.51 GiB

  • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

  • Chia tách :

Tách ra ví dụ
'train' 4.000
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (21,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
bước/quan sát/com_velocity tenxơ (3,) phao32
các bước/quan sát/dummy-0 tenxơ (1,) phao32
các bước/quan sát/dummy-1 tenxơ (1,) phao32
các bước/quan sát/dummy-2 tenxơ (1,) phao32
các bước/quan sát/dummy-3 tenxơ (1,) phao32
bước/quan sát/dummy-4 tenxơ (1,) phao32
các bước/quan sát/dummy-5 tenxơ (1,) phao32
các bước/quan sát/dummy-6 tenxơ (1,) phao32
các bước/quan sát/dummy-7 tenxơ (1,) phao32
bước/quan sát/dummy-8 tenxơ (1,) phao32
các bước/quan sát/dummy-9 tenxơ (1,) phao32
bước / quan sát / chi tenxơ (12,) phao32
bước/quan sát/head_height tenxơ (1,) phao32
bước/quan sát/joint_angles tenxơ (21,) phao32
bước/quan sát/torso_vertical tenxơ (3,) phao32
bước/quan sát/vận tốc tenxơ (27,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/humanoid_walk_combined_challenge_easy_40_percent

  • Kích thước tập dữ liệu : 3.01 GiB

  • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

  • Chia tách :

Tách ra ví dụ
'train' 8.000
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (21,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
bước/quan sát/com_velocity tenxơ (3,) phao32
các bước/quan sát/dummy-0 tenxơ (1,) phao32
các bước/quan sát/dummy-1 tenxơ (1,) phao32
các bước/quan sát/dummy-2 tenxơ (1,) phao32
các bước/quan sát/dummy-3 tenxơ (1,) phao32
bước/quan sát/dummy-4 tenxơ (1,) phao32
các bước/quan sát/dummy-5 tenxơ (1,) phao32
các bước/quan sát/dummy-6 tenxơ (1,) phao32
các bước/quan sát/dummy-7 tenxơ (1,) phao32
bước/quan sát/dummy-8 tenxơ (1,) phao32
các bước/quan sát/dummy-9 tenxơ (1,) phao32
bước / quan sát / chi tenxơ (12,) phao32
bước/quan sát/head_height tenxơ (1,) phao32
bước/quan sát/joint_angles tenxơ (21,) phao32
bước/quan sát/torso_vertical tenxơ (3,) phao32
bước/quan sát/vận tốc tenxơ (27,) phao32
bước/phần thưởng tenxơ (1,) phao32

rlu_rwrl/humanoid_walk_combined_challenge_easy_100_percent

  • Kích thước tập dữ liệu : 7.53 GiB

  • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

  • Chia tách :

Tách ra ví dụ
'train' 20.000
  • Cấu trúc tính năng :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tập_return tenxơ phao32
bước tập dữ liệu
bước/hành động tenxơ (21,) phao32
bước/giảm giá tenxơ (1,) phao32
các bước/is_first tenxơ bool
bước/is_last tenxơ bool
bước/is_terminal tenxơ bool
các bước/quan sát Tính năngDict
bước/quan sát/com_velocity tenxơ (3,) phao32
các bước/quan sát/dummy-0 tenxơ (1,) phao32
các bước/quan sát/dummy-1 tenxơ (1,) phao32
các bước/quan sát/dummy-2 tenxơ (1,) phao32
các bước/quan sát/dummy-3 tenxơ (1,) phao32
bước/quan sát/dummy-4 tenxơ (1,) phao32
các bước/quan sát/dummy-5 tenxơ (1,) phao32
các bước/quan sát/dummy-6 tenxơ (1,) phao32
các bước/quan sát/dummy-7 tenxơ (1,) phao32
bước/quan sát/dummy-8 tenxơ (1,) phao32
các bước/quan sát/dummy-9 tenxơ (1,) phao32
bước / quan sát / chi tenxơ (12,) phao32
bước/quan sát/head_height tenxơ (1,) phao32
bước/quan sát/joint_angles tenxơ (21,) phao32
bước/quan sát/torso_vertical tenxơ (3,) phao32
bước/quan sát/vận tốc tenxơ (27,) phao32
bước/phần thưởng tenxơ (1,) phao32