mèo con

Sự miêu tả :

Kitti chứa một bộ nhiệm vụ tầm nhìn được xây dựng bằng nền tảng lái xe tự động. Điểm chuẩn đầy đủ chứa nhiều tác vụ như âm thanh nổi, luồng quang, phép đo hình ảnh trực quan, v.v. Tập dữ liệu này chứa tập dữ liệu phát hiện đối tượng, bao gồm các hình ảnh một mắt và hộp giới hạn. Bộ dữ liệu chứa 7481 hình ảnh đào tạo được chú thích bằng các hộp giới hạn 3D. Bạn có thể tìm thấy mô tả đầy đủ về các chú thích trong phần readme của bộ công cụ phát triển đối tượng readme trên trang chủ Kitti.

Tài liệu bổ sung : Khám phá trên giấy tờ có mã
Trang chủ : http://www.cvlibs.net/datasets/kitti/
Mã nguồn : tfds.datasets.kitti.Builder
Phiên bản :
- 3.1.0 : Không có ghi chú phát hành.
- 3.2.0 : Devkit được cập nhật.
- 3.3.0 (mặc định): Đã thêm nhãn cho tính năng occluded .
Kích thước tải xuống : 11.71 GiB
Kích thước tập dữ liệu : 5.27 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :

Tách ra	Ví dụ
`'test'`	711
`'train'`	6.347
`'validation'`	423

Cấu trúc tính năng :

FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/file_name': Text(shape=(), dtype=string),
    'objects': Sequence({
        'alpha': float32,
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'dimensions': Tensor(shape=(3,), dtype=float32),
        'location': Tensor(shape=(3,), dtype=float32),
        'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
        'rotation_y': float32,
        'truncated': float32,
        'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
    }),
})

Tài liệu tính năng :

Tính năng	Lớp học	Hình dạng	loại D	Sự miêu tả
	Tính năngDict
hình ảnh	Hình ảnh	(Không, Không, 3)	uint8
hình ảnh/tên_tệp	Chữ		sợi dây
các đối tượng	Sự liên tiếp
đối tượng/alpha	Tenxơ		phao32	Góc quan sát của vật thể, trong khoảng [-pi..pi]
đối tượng/hộp	Tính năng BBox	(4,)	phao32	Hộp giới hạn 2D của đối tượng trong ảnh
đối tượng/kích thước	Tenxơ	(3,)	phao32	Kích thước đối tượng 3D: chiều cao, chiều rộng, chiều dài (tính bằng mét)
đồ vật/địa điểm	Tenxơ	(3,)	phao32	Vị trí đối tượng 3D x,y,z theo tọa độ camera (tính bằng mét)
đồ vật/bị chặn	Nhãn lớp		int64	Số nguyên (0,1,2,3) biểu thị trạng thái tắc: 0 = hiển thị hoàn toàn, 1 = bị tắc một phần2 = bị tắc phần lớn, 3 = không xác định
đối tượng/xoay_y	Tenxơ		phao32	Xoay quanh trục Y theo tọa độ camera [-pi..pi]
đối tượng/cắt ngắn	Tenxơ		phao32	Nổi từ 0 (không bị cắt ngắn) đến 1 (bị cắt ngắn), trong đó bị cắt ngắn đề cập đến đối tượng rời khỏi ranh giới hình ảnh
đồ vật/loại	Nhãn lớp		int64	Loại đối tượng, ví dụ: 'Ô tô' hoặc 'Van'

Khóa được giám sát (Xem as_supervised doc ): None
Hình ( tfds.show_examples ):

Hình dung

Ví dụ ( tfds.as_dataframe ):

Trích dẫn :

@inproceedings{Geiger2012CVPR,
  author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
  title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
  booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
  year = {2012}
}