nyu_deep_v2

  • คำอธิบาย :

ชุดข้อมูล NYU-Depth V2 ประกอบด้วยลำดับวิดีโอจากฉากต่างๆ ในอาคารที่บันทึกโดยกล้อง RGB และความลึกจาก Microsoft Kinect

แยก ตัวอย่าง
'train' 47,584
'validation' 654
  • โครงสร้างคุณลักษณะ :
FeaturesDict({
    'depth': Tensor(shape=(480, 640), dtype=float16),
    'image': Image(shape=(480, 640, 3), dtype=uint8),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
ความลึก เทนเซอร์ (480, 640) ลอย16
ภาพ ภาพ (480, 640, 3) uint8

การสร้างภาพ

  • การอ้างอิง :
@inproceedings{Silberman:ECCV12,
  author    = {Nathan Silberman, Derek Hoiem, Pushmeet Kohli and Rob Fergus},
  title     = {Indoor Segmentation and Support Inference from RGBD Images},
  booktitle = {ECCV},
  year      = {2012}
}
@inproceedings{icra_2019_fastdepth,
  author    = {Wofk, Diana and Ma, Fangchang and Yang, Tien-Ju and Karaman, Sertac and Sze, Vivienne},
  title     = {FastDepth: Fast Monocular Depth Estimation on Embedded Systems},
  booktitle = {IEEE International Conference on Robotics and Automation (ICRA)},
  year      = {2019}
}