ビジュアライゼーション: Know Your Data で探索する
説明:
Kitti には、自動運転プラットフォームを使用して構築された一連のビジョン タスクが含まれています。完全なベンチマークには、ステレオ、オプティカル フロー、ビジュアル オドメトリなどの多くのタスクが含まれています。このデータセットには、単眼画像やバウンディング ボックスなどのオブジェクト検出データセットが含まれています。データセットには、3D 境界ボックスで注釈が付けられた 7481 のトレーニング画像が含まれています。注釈の完全な説明は、Kitti ホームページのオブジェクト開発キットの readme に記載されています。
追加のドキュメント:コード を使用したペーパーの探索
ソースコード:
tfds.datasets.kitti.Builder
バージョン:
-
3.1.0
: リリース ノートはありません。 -
3.2.0
: Devkit が更新されました。 -
3.3.0
(デフォルト):occluded
機能のラベルが追加されました。
-
ダウンロードサイズ:
11.71 GiB
データセットサイズ:
5.27 GiB
自動キャッシュ(ドキュメント): いいえ
スプリット:
スプリット | 例 |
---|---|
'test' | 711 |
'train' | 6,347 |
'validation' | 423 |
- 機能構造:
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/file_name': Text(shape=(), dtype=string),
'objects': Sequence({
'alpha': float32,
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'dimensions': Tensor(shape=(3,), dtype=float32),
'location': Tensor(shape=(3,), dtype=float32),
'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
'rotation_y': float32,
'truncated': float32,
'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
}),
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
画像 | 画像 | (なし、なし、3) | uint8 | |
画像/ファイル名 | 文章 | ストリング | ||
オブジェクト | 順序 | |||
オブジェクト/アルファ | テンソル | float32 | 物体の観察角度、範囲 [-pi..pi] | |
オブジェクト/bbox | BBoxFeature | (4) | float32 | 画像内のオブジェクトの 2D バウンディング ボックス |
オブジェクト/寸法 | テンソル | (3) | float32 | 3D オブジェクトの寸法: 高さ、幅、長さ (メートル単位) |
オブジェクト/場所 | テンソル | (3) | float32 | カメラ座標での 3D オブジェクトの位置 x、y、z (メートル単位) |
オブジェクト/オクルード | クラスラベル | int64 | オクルージョンの状態を示す整数 (0,1,2,3): 0 = 完全に見える、1 = 部分的にオクルージョン2 = 大部分がオクルージョン、3 = 不明 | |
オブジェクト/rotation_y | テンソル | float32 | カメラ座標の Y 軸周りの回転 ry [-pi..pi] | |
オブジェクト/切り捨て | テンソル | float32 | 0 (切り捨てられていない) から 1 (切り捨てられた) までの浮動小数点数。 | |
オブジェクト/タイプ | クラスラベル | int64 | オブジェクトのタイプ (「車」や「バン」など) |
監視されたキー(
as_supervised
docを参照):None
図( tfds.show_examples ):
- 例( tfds.as_dataframe ):
- 引用:
@inproceedings{Geiger2012CVPR,
author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
year = {2012}
}