- תיאור :
Kitti מכיל חבילה של משימות ראייה שנבנו באמצעות פלטפורמת נהיגה אוטונומית. ה-benchmark המלא מכיל משימות רבות כגון סטריאו, זרימה אופטית, בדיקת מרחק חזותית וכו'. מערך נתונים זה מכיל את מערך הנתונים של זיהוי האובייקטים, כולל התמונות המונוקולריות והתיבות התוחמות. מערך הנתונים מכיל 7481 תמונות אימון עם הערות בתיבות תוחמות תלת ממדיות. ניתן למצוא תיאור מלא של ההערות ב-readme של ערכת פיתוח האובייקט readme בדף הבית של Kitti.
תיעוד נוסף : חקור על ניירות עם קוד
דף הבית : http://www.cvlibs.net/datasets/kitti/
קוד מקור :
tfds.datasets.kitti.Builder
גרסאות :
-
3.1.0
: אין הערות שחרור. -
3.2.0
: Devkit עודכן. -
3.3.0
(ברירת מחדל): נוספו תוויות עבור התכונהoccluded
.
-
גודל הורדה :
11.71 GiB
גודל מערך נתונים :
5.27 GiB
שמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 711 |
'train' | 6,347 |
'validation' | 423 |
- מבנה תכונה :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/file_name': Text(shape=(), dtype=string),
'objects': Sequence({
'alpha': float32,
'bbox': BBoxFeature(shape=(4,), dtype=float32, description=2D bounding box of object in the image),
'dimensions': Tensor(shape=(3,), dtype=float32, description=3D object dimensions: height, width, length (in meters)),
'location': Tensor(shape=(3,), dtype=float32, description=3D object location x,y,z in camera coordinates (in meters)),
'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
'rotation_y': float32,
'truncated': float32,
'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
}),
})
- תיעוד תכונה :
תכונה | מַחלָקָה | צוּרָה | Dtype | תֵאוּר |
---|---|---|---|---|
FeaturesDict | ||||
תְמוּנָה | תְמוּנָה | (אין, אין, 3) | uint8 | |
image/file_name | טֶקסט | חוּט | ||
חפצים | רֶצֶף | |||
חפצים/אלפא | מוֹתֵחַ | לצוף32 | זווית תצפית של אובייקט, בטווח [-pi..pi] | |
אובייקטים/bbox | BBoxFeature | (4,) | לצוף32 | תיבת תוחמת דו-ממדית של אובייקט בתמונה |
חפצים/מידות | מוֹתֵחַ | (3,) | לצוף32 | ממדי אובייקט תלת מימד: גובה, רוחב, אורך (במטרים) |
חפצים/מיקום | מוֹתֵחַ | (3,) | לצוף32 | מיקום אובייקט תלת-ממדי x,y,z בקואורדינטות של המצלמה (במטרים) |
חפצים/חסומים | ClassLabel | int64 | מספר שלם (0,1,2,3) המציין מצב חסימה: 0 = גלוי לחלוטין, 1 = חסום חלקית 2 = חסום ברובו, 3 = לא ידוע | |
objects/rotation_y | מוֹתֵחַ | לצוף32 | סיבוב רי סביב ציר Y בקואורדינטות המצלמה [-pi..pi] | |
חפצים/קטועים | מוֹתֵחַ | לצוף32 | צף מ-0 (לא קצוץ) ל-1 (קטוע), כאשר קצוץ מתייחס לאובייקט שעוזב את גבולות התמונה | |
אובייקטים/סוג | ClassLabel | int64 | סוג האובייקט, למשל 'מכונית' או 'וואן' |
מפתחות בפיקוח (ראה
as_supervised
doc ):None
איור ( tfds.show_examples ):
- דוגמאות ( tfds.as_dataframe ):
- ציטוט :
@inproceedings{Geiger2012CVPR,
author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
year = {2012}
}