كيتي

يحتوي Kitti على مجموعة من مهام الرؤية التي تم إنشاؤها باستخدام منصة قيادة ذاتية. يحتوي المعيار الكامل على العديد من المهام مثل الاستريو والتدفق البصري وقياس المسافات البصري وما إلى ذلك. تحتوي مجموعة البيانات هذه على مجموعة بيانات اكتشاف الكائن ، بما في ذلك الصور الأحادية والمربعات المحيطة. تحتوي مجموعة البيانات على 7481 صورة تدريب مشروحة بمربعات إحاطة ثلاثية الأبعاد. يمكن العثور على وصف كامل للتعليقات التوضيحية في الملف التمهيدي لملف تطوير الكائن التمهيدي على صفحة Kitti الرئيسية.

انشق، مزق أمثلة
'test' 711
'train' 6347
'validation' 423
  • هيكل الميزة :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/file_name': Text(shape=(), dtype=string),
    'objects': Sequence({
        'alpha': float32,
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'dimensions': Tensor(shape=(3,), dtype=float32),
        'location': Tensor(shape=(3,), dtype=float32),
        'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
        'rotation_y': float32,
        'truncated': float32,
        'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
    }),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
صورة صورة (لا شيء ، لا شيء ، 3) uint8
الصورة / اسم_الملف نص سلسلة
أشياء تسلسل
كائنات / ألفا موتر تعويم 32 زاوية مراقبة الكائن ، تتراوح [-pi..pi]
كائنات / bbox ميزة BBox (4 ،) تعويم 32 مربع إحاطة ثنائي الأبعاد للكائن في الصورة
الأشياء / الأبعاد موتر (3 ،) تعويم 32 أبعاد الكائن ثلاثي الأبعاد: الارتفاع والعرض والطول (بالأمتار)
الأشياء / الموقع موتر (3 ،) تعويم 32 موقع الكائن ثلاثي الأبعاد س ، ص ، ع في إحداثيات الكاميرا (بالأمتار)
الأشياء / المسدودة ClassLabel int64 عدد صحيح (0،1،2،3) يشير إلى حالة الانسداد: 0 = مرئي تمامًا ، 1 = مغلق جزئيًا 2 = مغلق إلى حد كبير ، 3 = غير معروف
الكائنات / rotation_y موتر تعويم 32 الدوران حول المحور Y في إحداثيات الكاميرا [-pi..pi]
كائنات / مقطوعة موتر تعويم 32 تعويم من 0 (غير مقطوع) إلى 1 (مقطوع) ، حيث يشير المبتور إلى الكائن الذي يترك حدود الصورة
الكائنات / النوع ClassLabel int64 نوع الشيء ، على سبيل المثال "سيارة" أو "شاحنة صغيرة"

التصور

  • الاقتباس :
@inproceedings{Geiger2012CVPR,
  author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
  title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
  booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
  year = {2012}
}