Görselleştirme : Verilerinizi Bilin keşfedin
Açıklama :
Kitti, otonom bir sürüş platformu kullanılarak oluşturulmuş bir dizi görme görevi içerir. Tam kıyaslama, stereo, optik akış, görsel odometri vb. gibi birçok görevi içerir. Bu veri seti, monoküler görüntüler ve sınırlayıcı kutular dahil olmak üzere nesne algılama veri setini içerir. Veri seti, 3B sınırlayıcı kutularla açıklamalı 7481 eğitim görüntüsü içerir. Ek açıklamaların tam açıklaması, Kitti ana sayfasındaki nesne geliştirme kiti benioku dosyasında bulunabilir.
Ana Sayfa : http://www.cvlibs.net/datasets/kitti/
Kaynak kodu :
tfds.datasets.kitti.Builder
sürümler :
-
3.1.0
: Sürüm notu yok. -
3.2.0
: Devkit güncellendi. -
3.3.0
(varsayılan):occluded
özellik için etiketler eklendi.
-
İndirme boyutu :
11.71 GiB
Veri kümesi boyutu :
5.27 GiB
Otomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 711 |
'train' | 6.347 |
'validation' | 423 |
- Özellik yapısı :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/file_name': Text(shape=(), dtype=string),
'objects': Sequence({
'alpha': float32,
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'dimensions': Tensor(shape=(3,), dtype=float32),
'location': Tensor(shape=(3,), dtype=float32),
'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
'rotation_y': float32,
'truncated': float32,
'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
görüntü | resim | (Yok, Yok, 3) | uint8 | |
resim/dosya_adı | Metin | sicim | ||
nesneler | Sekans | |||
nesneler/alfa | tensör | şamandıra32 | [-pi..pi] arasında değişen nesnenin gözlem açısı | |
nesneler/bbox | BBoxÖzelliği | (4,) | şamandıra32 | Görüntüdeki nesnenin 2B sınırlayıcı kutusu |
nesneler/boyutlar | tensör | (3,) | şamandıra32 | 3B nesne boyutları: yükseklik, genişlik, uzunluk (metre cinsinden) |
nesneler/konum | tensör | (3,) | şamandıra32 | Kamera koordinatlarında (metre olarak) 3B nesne konumu x,y,z |
nesneler/tıkanmış | SınıfEtiketi | int64 | Oklüzyon durumunu gösteren tamsayı (0,1,2,3): 0 = tamamen görünür, 1 = kısmen tıkalı2 = büyük ölçüde tıkalı, 3 = bilinmiyor | |
nesneler/döndürme_y | tensör | şamandıra32 | Kamera koordinatlarında Y ekseni etrafında dönüş [-pi..pi] | |
nesneler/kesilmiş | tensör | şamandıra32 | 0'dan (kesilmemiş) 1'e (kesilmiş) kayan, burada kesik görüntü sınırlarını terk eden nesneyi ifade eder | |
nesneler/tür | SınıfEtiketi | int64 | Nesnenin türü, örneğin "Araba" veya "Van" |
Denetlenen anahtarlar (Bkz.
as_supervised
doc ):None
Şekil ( tfds.show_examples ):
- Örnekler ( tfds.as_dataframe ):
- Alıntı :
@inproceedings{Geiger2012CVPR,
author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
year = {2012}
}