کیتی

توضیحات :

کیتی شامل مجموعه ای از وظایف بینایی است که با استفاده از یک پلت فرم رانندگی مستقل ساخته شده اند. معیار کامل شامل وظایف بسیاری مانند استریو، جریان نوری، کیلومتر شماری بصری، و غیره است. این مجموعه داده شامل مجموعه داده های تشخیص اشیا، از جمله تصاویر تک چشمی و جعبه های مرزی است. مجموعه داده شامل 7481 تصویر آموزشی است که با جعبه های مرزبندی سه بعدی حاشیه نویسی شده است. شرح کامل حاشیه نویسی ها را می توان در readme کیت توسعه شی readme در صفحه اصلی کیتی یافت.

اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : http://www.cvlibs.net/datasets/kitti/
کد منبع : tfds.datasets.kitti.Builder
نسخه ها :
- 3.1.0 : بدون یادداشت انتشار.
- 3.2.0 : Devkit به روز شد.
- 3.3.0 (پیش‌فرض): برچسب‌هایی برای ویژگی occluded اضافه شده است.
حجم دانلود : 11.71 GiB
حجم مجموعه داده : 5.27 GiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :

تقسیم کنید	نمونه ها
`'test'`	711
`'train'`	6,347
`'validation'`	423

ساختار ویژگی :

FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/file_name': Text(shape=(), dtype=string),
    'objects': Sequence({
        'alpha': float32,
        'bbox': BBoxFeature(shape=(4,), dtype=float32, description=2D bounding box of object in the image),
        'dimensions': Tensor(shape=(3,), dtype=float32, description=3D object dimensions: height, width, length (in meters)),
        'location': Tensor(shape=(3,), dtype=float32, description=3D object location x,y,z in camera coordinates (in meters)),
        'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
        'rotation_y': float32,
        'truncated': float32,
        'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
    }),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D	توضیحات
	FeaturesDict
تصویر	تصویر	(هیچ، هیچ، 3)	uint8
تصویر/نام_فایل	متن		رشته
اشیاء	دنباله
اشیاء/آلفا	تانسور		float32	زاویه مشاهده جسم، محدوده [-pi..pi]
اشیاء/bbox	ویژگی BBox	(4،)	float32	جعبه محدود کننده دوبعدی شی در تصویر
اشیاء / ابعاد	تانسور	(3،)	float32	ابعاد جسم سه بعدی: ارتفاع، عرض، طول (بر حسب متر)
اشیاء / مکان	تانسور	(3،)	float32	مکان شی سه بعدی x,y,z در مختصات دوربین (بر حسب متر)
اشیاء / مسدود شده	ClassLabel		int64	عدد صحیح (0،1،2،3) نشان دهنده وضعیت انسداد: 0 = کاملا قابل مشاهده، 1 = تا حدی مسدود شده2 = تا حد زیادی مسدود، 3 = ناشناخته
اشیاء/چرخش_y	تانسور		float32	چرخش حول محور Y در مختصات دوربین [-pi..pi]
اشیاء / کوتاه شده	تانسور		float32	شناور از 0 (غیر کوتاه) به 1 (قطع شده)، که در آن کوتاه شده به جسمی که از مرزهای تصویر خارج می شود اشاره دارد.
اشیاء/نوع	ClassLabel		int64	نوع شی، به عنوان مثال "ماشین" یا "ون"

کلیدهای نظارت شده (به as_supervised doc مراجعه کنید): None
شکل ( tfds.show_examples ):

تجسم

مثال‌ها ( tfds.as_dataframe ):

نقل قول :

@inproceedings{Geiger2012CVPR,
  author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
  title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
  booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
  year = {2012}
}

کیتی با مجموعه‌ها، منظم بمانید ذخیره و طبقه‌بندی محتوا براساس اولویت‌های شما.

کیتی