किट्टी

किट्टी में एक स्वायत्त ड्राइविंग प्लेटफॉर्म का उपयोग करके निर्मित दृष्टि कार्यों का एक सूट होता है। पूर्ण बेंचमार्क में स्टीरियो, ऑप्टिकल फ्लो, विज़ुअल ओडोमेट्री आदि जैसे कई कार्य शामिल हैं। इस डेटासेट में मोनोक्युलर इमेज और बाउंडिंग बॉक्स सहित ऑब्जेक्ट डिटेक्शन डेटासेट शामिल हैं। डेटासेट में 3D बाउंडिंग बॉक्स के साथ एनोटेट की गई 7481 प्रशिक्षण छवियां हैं। एनोटेशन का पूरा विवरण किट्टी होमपेज पर ऑब्जेक्ट डेवलपमेंट किट रीडमी के रीडमी में पाया जा सकता है।

विभाजित करना उदाहरण
'test' 711
'train' 6,347
'validation' 423
  • फ़ीचर संरचना :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/file_name': Text(shape=(), dtype=string),
    'objects': Sequence({
        'alpha': float32,
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'dimensions': Tensor(shape=(3,), dtype=float32),
        'location': Tensor(shape=(3,), dtype=float32),
        'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
        'rotation_y': float32,
        'truncated': float32,
        'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
    }),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
छवि छवि (कोई नहीं, कोई नहीं, 3) uint8
छवि/file_name मूलपाठ डोरी
वस्तुओं क्रम
ऑब्जेक्ट्स/alpha टेन्सर फ्लोट32 वस्तु का अवलोकन कोण, रेंज [-pi..pi]
ऑब्जेक्ट्स/बीबॉक्स बीबॉक्स फीचर (4,) फ्लोट32 छवि में वस्तु का 2D बाउंडिंग बॉक्स
वस्तुओं/आयामों टेन्सर (3,) फ्लोट32 3डी ऑब्जेक्ट आयाम: ऊंचाई, चौड़ाई, लंबाई (मीटर में)
वस्तुओं / स्थान टेन्सर (3,) फ्लोट32 कैमरे के निर्देशांक में 3डी वस्तु स्थान x, y, z (मीटर में)
वस्तुओं/बंद क्लासलेबल int64 पूर्णांक (0,1,2,3) रोड़ा स्थिति का संकेत: 0 = पूरी तरह से दिखाई, 1 = आंशिक रूप से occluded2 = मोटे तौर पर occluded, 3 = अज्ञात
ऑब्जेक्ट्स/रोटेशन_y टेन्सर फ्लोट32 कैमरा निर्देशांक में Y-अक्ष के चारों ओर घूर्णन ry [-pi..pi]
वस्तुओं/छंटनी टेन्सर फ्लोट32 0 (गैर-कांट-छांट) से 1 (काट-छाँट) तक फ़्लोट करें, जहाँ पर काट-छाँट की गई छवि सीमाओं को छोड़कर वस्तु को संदर्भित करती है
वस्तुओं/प्रकार क्लासलेबल int64 वस्तु का प्रकार, उदाहरण के लिए 'कार' या 'वैन'

VISUALIZATION

  • उद्धरण :
@inproceedings{Geiger2012CVPR,
  author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
  title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
  booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
  year = {2012}
}