কিট্টি

কিট্টিতে একটি স্বায়ত্তশাসিত ড্রাইভিং প্ল্যাটফর্ম ব্যবহার করে নির্মিত দৃষ্টি কাজের একটি স্যুট রয়েছে। সম্পূর্ণ বেঞ্চমার্কে স্টেরিও, অপটিক্যাল ফ্লো, ভিজ্যুয়াল ওডোমেট্রি ইত্যাদির মতো অনেক কাজ রয়েছে। এই ডেটাসেটে একরঙা ছবি এবং বাউন্ডিং বক্স সহ অবজেক্ট ডিটেকশন ডেটাসেট রয়েছে। ডেটাসেটে 3D বাউন্ডিং বাক্সের সাথে টীকাযুক্ত 7481টি প্রশিক্ষণ চিত্র রয়েছে। কিট্টি হোমপেজে অবজেক্ট ডেভেলপমেন্ট কিট রিডমি-তে টীকাগুলির সম্পূর্ণ বিবরণ পাওয়া যাবে।

বিভক্ত উদাহরণ
'test' 711
'train' ৬,৩৪৭
'validation' 423
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/file_name': Text(shape=(), dtype=string),
    'objects': Sequence({
        'alpha': float32,
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'dimensions': Tensor(shape=(3,), dtype=float32),
        'location': Tensor(shape=(3,), dtype=float32),
        'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
        'rotation_y': float32,
        'truncated': float32,
        'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
ইমেজ ছবি (কোনটিই নয়, 3) uint8
image/file_name পাঠ্য স্ট্রিং
বস্তু ক্রম
বস্তু/আলফা টেনসর float32 বস্তুর পর্যবেক্ষণ কোণ, পরিসর [-pi..pi]
বস্তু/bbox বিবক্স ফিচার (৪,) float32 ছবিতে বস্তুর 2D বাউন্ডিং বক্স
বস্তু/মাত্রা টেনসর (৩,) float32 3D বস্তুর মাত্রা: উচ্চতা, প্রস্থ, দৈর্ঘ্য (মিটারে)
বস্তু/অবস্থান টেনসর (৩,) float32 ক্যামেরা স্থানাঙ্কে 3D অবজেক্টের অবস্থান x,y,z (মিটারে)
বস্তু/অবরোধ ক্লাসলেবেল int64 পূর্ণসংখ্যা (0,1,2,3) অবরোধ অবস্থা নির্দেশ করে: 0 = সম্পূর্ণরূপে দৃশ্যমান, 1 = আংশিকভাবে আটকানো2 = ব্যাপকভাবে আটকানো, 3 = অজানা
বস্তু/ঘূর্ণন_y টেনসর float32 ক্যামেরা স্থানাঙ্কে Y-অক্ষের চারপাশে ঘূর্ণন [-pi..pi]
বস্তু/কাটা টেনসর float32 0 (অ-কাটা) থেকে 1 (ছাঁটা) পর্যন্ত ভাসমান, যেখানে ছাঁটা মানে ছবির সীমানা ছেড়ে থাকা বস্তুকে বোঝায়
বস্তু/প্রকার ক্লাসলেবেল int64 বস্তুর ধরন, যেমন 'কার' বা 'ভ্যান'

ভিজ্যুয়ালাইজেশন

  • উদ্ধৃতি :
@inproceedings{Geiger2012CVPR,
  author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
  title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
  booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
  year = {2012}
}