kedicik

Kitti, otonom bir sürüş platformu kullanılarak oluşturulmuş bir dizi görme görevi içerir. Tam kıyaslama, stereo, optik akış, görsel odometri vb. gibi birçok görevi içerir. Bu veri seti, monoküler görüntüler ve sınırlayıcı kutular dahil olmak üzere nesne algılama veri setini içerir. Veri seti, 3B sınırlayıcı kutularla açıklamalı 7481 eğitim görüntüsü içerir. Ek açıklamaların tam açıklaması, Kitti ana sayfasındaki nesne geliştirme kiti benioku dosyasında bulunabilir.

Bölmek örnekler
'test' 711
'train' 6.347
'validation' 423
  • Özellik yapısı :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/file_name': Text(shape=(), dtype=string),
    'objects': Sequence({
        'alpha': float32,
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'dimensions': Tensor(shape=(3,), dtype=float32),
        'location': Tensor(shape=(3,), dtype=float32),
        'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
        'rotation_y': float32,
        'truncated': float32,
        'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
görüntü resim (Yok, Yok, 3) uint8
resim/dosya_adı Metin sicim
nesneler Sekans
nesneler/alfa tensör şamandıra32 [-pi..pi] arasında değişen nesnenin gözlem açısı
nesneler/bbox BBoxÖzelliği (4,) şamandıra32 Görüntüdeki nesnenin 2B sınırlayıcı kutusu
nesneler/boyutlar tensör (3,) şamandıra32 3B nesne boyutları: yükseklik, genişlik, uzunluk (metre cinsinden)
nesneler/konum tensör (3,) şamandıra32 Kamera koordinatlarında (metre olarak) 3B nesne konumu x,y,z
nesneler/tıkanmış SınıfEtiketi int64 Oklüzyon durumunu gösteren tamsayı (0,1,2,3): 0 = tamamen görünür, 1 = kısmen tıkalı2 = büyük ölçüde tıkalı, 3 = bilinmiyor
nesneler/döndürme_y tensör şamandıra32 Kamera koordinatlarında Y ekseni etrafında dönüş [-pi..pi]
nesneler/kesilmiş tensör şamandıra32 0'dan (kesilmemiş) 1'e (kesilmiş) kayan, burada kesik görüntü sınırlarını terk eden nesneyi ifade eder
nesneler/tür SınıfEtiketi int64 Nesnenin türü, örneğin "Araba" veya "Van"

görselleştirme

  • Alıntı :
@inproceedings{Geiger2012CVPR,
  author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
  title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
  booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
  year = {2012}
}