एमएल समुदाय दिवस 9 नवंबर है! TensorFlow, JAX से नई जानकारी के लिए हमसे जुड़ें, और अधिक जानें

किट्टी

किट्टी में एक स्वायत्त ड्राइविंग प्लेटफॉर्म का उपयोग करके निर्मित दृष्टि कार्यों का एक सूट है। पूर्ण बेंचमार्क में स्टीरियो, ऑप्टिकल फ्लो, विज़ुअल ओडोमेट्री आदि जैसे कई कार्य होते हैं। इस डेटासेट में मोनोकुलर इमेज और बाउंडिंग बॉक्स सहित ऑब्जेक्ट डिटेक्शन डेटासेट होता है। डेटासेट में 3D बाउंडिंग बॉक्स के साथ एनोटेट की गई 7481 प्रशिक्षण छवियां हैं। एनोटेशन का पूरा विवरण किट्टी होमपेज पर ऑब्जेक्ट डेवलपमेंट किट रीडमी के रीडमी में पाया जा सकता है।

  • होमपेज: http://www.cvlibs.net/datasets/kitti/

  • स्रोत कोड: tfds.object_detection.Kitti

  • संस्करण:

    • 3.1.0 : नहीं रिलीज नोट्स।
    • 3.2.0 (डिफ़ॉल्ट): Devkit अपडेट किया गया।
  • डाउनलोड का आकार: 11.71 GiB

  • डेटासेट का आकार: 5.27 GiB

  • ऑटो-कैश ( प्रलेखन ): नहीं

  • विभाजन:

विभाजित करना उदाहरण
'test' 711
'train' 6,347
'validation' 423
  • विशेषताएं:
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'image/file_name': Text(shape=(), dtype=tf.string),
    'objects': Sequence({
        'alpha': tf.float32,
        'bbox': BBoxFeature(shape=(4,), dtype=tf.float32),
        'dimensions': Tensor(shape=(3,), dtype=tf.float32),
        'location': Tensor(shape=(3,), dtype=tf.float32),
        'occluded': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
        'rotation_y': tf.float32,
        'truncated': tf.float32,
        'type': ClassLabel(shape=(), dtype=tf.int64, num_classes=8),
    }),
})

VISUALIZATION

  • प्रशस्ति पत्र:
@inproceedings{Geiger2012CVPR,
  author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
  title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
  booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
  year = {2012}
}