التصور : استكشف في اعرف بياناتك
الوصف :
يحتوي Kitti على مجموعة من مهام الرؤية التي تم إنشاؤها باستخدام منصة قيادة ذاتية. يحتوي المعيار الكامل على العديد من المهام مثل الاستريو والتدفق البصري وقياس المسافات البصري وما إلى ذلك. تحتوي مجموعة البيانات هذه على مجموعة بيانات اكتشاف الكائن ، بما في ذلك الصور الأحادية والمربعات المحيطة. تحتوي مجموعة البيانات على 7481 صورة تدريب مشروحة بمربعات إحاطة ثلاثية الأبعاد. يمكن العثور على وصف كامل للتعليقات التوضيحية في الملف التمهيدي لملف تطوير الكائن التمهيدي على صفحة Kitti الرئيسية.
وثائق إضافية : استكشف في الأوراق باستخدام الرمز
الصفحة الرئيسية : http://www.cvlibs.net/datasets/kitti/
كود المصدر :
tfds.datasets.kitti.Builder
إصدارات :
-
3.1.0
: لا توجد ملاحظات الإصدار. -
3.2.0
: تم تحديث Devkit. -
3.3.0
(افتراضي): تمت إضافة تسميات للميزةoccluded
.
-
حجم التحميل :
11.71 GiB
حجم مجموعة البيانات :
5.27 GiB
التخزين المؤقت التلقائي ( التوثيق ): لا
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'test' | 711 |
'train' | 6347 |
'validation' | 423 |
- هيكل الميزة :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/file_name': Text(shape=(), dtype=string),
'objects': Sequence({
'alpha': float32,
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'dimensions': Tensor(shape=(3,), dtype=float32),
'location': Tensor(shape=(3,), dtype=float32),
'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
'rotation_y': float32,
'truncated': float32,
'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
}),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
صورة | صورة | (لا شيء ، لا شيء ، 3) | uint8 | |
الصورة / اسم_الملف | نص | سلسلة | ||
أشياء | تسلسل | |||
كائنات / ألفا | موتر | تعويم 32 | زاوية مراقبة الكائن ، تتراوح [-pi..pi] | |
كائنات / bbox | ميزة BBox | (4 ،) | تعويم 32 | مربع إحاطة ثنائي الأبعاد للكائن في الصورة |
الأشياء / الأبعاد | موتر | (3 ،) | تعويم 32 | أبعاد الكائن ثلاثي الأبعاد: الارتفاع والعرض والطول (بالأمتار) |
الأشياء / الموقع | موتر | (3 ،) | تعويم 32 | موقع الكائن ثلاثي الأبعاد س ، ص ، ع في إحداثيات الكاميرا (بالأمتار) |
الأشياء / المسدودة | ClassLabel | int64 | عدد صحيح (0،1،2،3) يشير إلى حالة الانسداد: 0 = مرئي تمامًا ، 1 = مغلق جزئيًا 2 = مغلق إلى حد كبير ، 3 = غير معروف | |
الكائنات / rotation_y | موتر | تعويم 32 | الدوران حول المحور Y في إحداثيات الكاميرا [-pi..pi] | |
كائنات / مقطوعة | موتر | تعويم 32 | تعويم من 0 (غير مقطوع) إلى 1 (مقطوع) ، حيث يشير المبتور إلى الكائن الذي يترك حدود الصورة | |
الكائنات / النوع | ClassLabel | int64 | نوع الشيء ، على سبيل المثال "سيارة" أو "شاحنة صغيرة" |
المفاتيح الخاضعة للإشراف (انظر المستند
as_supervised
):None
الشكل ( tfds.show_examples ):
- أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@inproceedings{Geiger2012CVPR,
author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
year = {2012}
}