dmlab

Bộ dữ liệu Dmlab chứa các khung được quan sát bởi tác nhân hoạt động trong môi trường DeepMind Lab, được chú thích bằng khoảng cách giữa tác nhân và các đối tượng khác nhau có trong môi trường. Mục tiêu là để đánh giá khả năng của một mô hình trực quan suy luận về khoảng cách từ đầu vào trực quan trong môi trường 3D. Bộ dữ liệu Dmlab bao gồm các hình ảnh màu 360x480 trong 6 lớp. Các lớp lần lượt là {gần, xa, rất xa} x {phần thưởng tích cực, phần thưởng tiêu cực}.

Tách ra ví dụ
'test' 22,735
'train' 65.550
'validation' 22,628
  • Cấu trúc tính năng :
FeaturesDict({
    'filename': Text(shape=(), dtype=string),
    'image': Image(shape=(360, 480, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
tên tập tin Chữ sợi dây
hình ảnh Hình ảnh (360, 480, 3) uint8
nhãn mác LớpNhãn int64

Hình dung

  • trích dẫn :
@article{zhai2019visual,
        title={The Visual Task Adaptation Benchmark},
        author={Xiaohua Zhai and Joan Puigcerver and Alexander Kolesnikov and
               Pierre Ruyssen and Carlos Riquelme and Mario Lucic and
               Josip Djolonga and Andre Susano Pinto and Maxim Neumann and
               Alexey Dosovitskiy and Lucas Beyer and Olivier Bachem and
               Michael Tschannen and Marcin Michalski and Olivier Bousquet and
               Sylvain Gelly and Neil Houlsby},
                              year={2019},
                              eprint={1910.04867},
                              archivePrefix={arXiv},
                              primaryClass={cs.CV},
                              url = {https://arxiv.org/abs/1910.04867}
                          }