nyu_depth_v2

  • Mô tả :

Bộ dữ liệu NYU-Depth V2 bao gồm các chuỗi video từ nhiều cảnh trong nhà khác nhau được ghi lại bởi cả camera RGB và camera Độ sâu từ Microsoft Kinect.

Tách ra ví dụ
'train' 47,584
'validation' 654
  • Cấu trúc tính năng :
FeaturesDict({
    'depth': Tensor(shape=(480, 640), dtype=float16),
    'image': Image(shape=(480, 640, 3), dtype=uint8),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
chiều sâu tenxơ (480, 640) phao16
hình ảnh Hình ảnh (480, 640, 3) uint8

Hình dung

  • trích dẫn :
@inproceedings{Silberman:ECCV12,
  author    = {Nathan Silberman, Derek Hoiem, Pushmeet Kohli and Rob Fergus},
  title     = {Indoor Segmentation and Support Inference from RGBD Images},
  booktitle = {ECCV},
  year      = {2012}
}
@inproceedings{icra_2019_fastdepth,
  author    = {Wofk, Diana and Ma, Fangchang and Yang, Tien-Ju and Karaman, Sertac and Sze, Vivienne},
  title     = {FastDepth: Fast Monocular Depth Estimation on Embedded Systems},
  booktitle = {IEEE International Conference on Robotics and Automation (ICRA)},
  year      = {2019}
}