กิตติ

กิตติมีชุดงานด้านการมองเห็นที่สร้างขึ้นโดยใช้แพลตฟอร์มการขับขี่อัตโนมัติ การวัดประสิทธิภาพแบบสมบูรณ์ประกอบด้วยงานหลายอย่าง เช่น สเตอริโอ ออปติคัลโฟลว์ การวัดสัดส่วนภาพ และอื่นๆ ชุดข้อมูลนี้มีชุดข้อมูลการตรวจจับวัตถุ รวมถึงภาพข้างเดียวและกล่องขอบ ชุดข้อมูลประกอบด้วยรูปภาพการฝึก 7481 รูปที่มีคำอธิบายประกอบด้วยกล่องขอบ 3 มิติ คำอธิบายแบบเต็มของคำอธิบายประกอบสามารถพบได้ใน readme ของชุดพัฒนาอ็อบเจกต์ readme ในหน้าแรกของ Kitti

แยก ตัวอย่าง
'test' 711
'train' 6,347
'validation' 423
  • โครงสร้างคุณลักษณะ :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/file_name': Text(shape=(), dtype=string),
    'objects': Sequence({
        'alpha': float32,
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'dimensions': Tensor(shape=(3,), dtype=float32),
        'location': Tensor(shape=(3,), dtype=float32),
        'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
        'rotation_y': float32,
        'truncated': float32,
        'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
    }),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
ภาพ ภาพ (ไม่มี, ไม่มี, 3) uint8
รูปภาพ/file_name ข้อความ สตริง
วัตถุ ลำดับ
วัตถุ/อัลฟ่า เทนเซอร์ ลอย32 มุมสังเกตของวัตถุ ตั้งแต่ [-pi..pi]
วัตถุ/bbox คุณสมบัติ BBox (4,) ลอย32 กล่องขอบเขต 2 มิติของวัตถุในภาพ
วัตถุ/มิติ เทนเซอร์ (3,) ลอย32 ขนาดวัตถุ 3 มิติ: ความสูง ความกว้าง ความยาว (หน่วยเป็นเมตร)
วัตถุ/สถานที่ เทนเซอร์ (3,) ลอย32 ตำแหน่งวัตถุ 3 มิติ x,y,z ในพิกัดกล้อง (หน่วยเป็นเมตร)
วัตถุ / บดบัง ป้ายกำกับคลาส int64 จำนวนเต็ม (0,1,2,3) ระบุสถานะการบดบัง: 0 = มองเห็นได้ทั้งหมด 1 = บดบังบางส่วน 2 = บดบังเป็นส่วนใหญ่ 3 = ไม่ทราบ
วัตถุ/rotation_y เทนเซอร์ ลอย32 การหมุนรอบแกน Y ในพิกัดกล้อง [-pi..pi]
วัตถุ / ตัดทอน เทนเซอร์ ลอย32 ลอยจาก 0 (ไม่ตัดทอน) ถึง 1 (ตัดทอน) โดยที่ตัดทอนหมายถึงวัตถุที่ออกจากขอบเขตภาพ
วัตถุ/ประเภท ป้ายกำกับคลาส int64 ประเภทของวัตถุ เช่น 'รถยนต์' หรือ 'รถตู้'

การสร้างภาพ

  • การอ้างอิง :
@inproceedings{Geiger2012CVPR,
  author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
  title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
  booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
  year = {2012}
}