kotek

Kitti zawiera zestaw zadań wizyjnych zbudowanych przy użyciu platformy autonomicznej jazdy. Pełny test porównawczy zawiera wiele zadań, takich jak stereo, przepływ optyczny, wizualna odometria itp. Ten zestaw danych zawiera zestaw danych wykrywania obiektów, w tym obrazy monokularowe i obwiednie. Zbiór danych zawiera 7481 obrazów treningowych z adnotacjami za pomocą ramek ograniczających 3D. Pełny opis adnotacji można znaleźć w pliku readme zestawu do tworzenia obiektów na stronie domowej Kitti.

Rozdzielać Przykłady
'test' 711
'train' 6347
'validation' 423
  • Struktura funkcji :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/file_name': Text(shape=(), dtype=string),
    'objects': Sequence({
        'alpha': float32,
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'dimensions': Tensor(shape=(3,), dtype=float32),
        'location': Tensor(shape=(3,), dtype=float32),
        'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
        'rotation_y': float32,
        'truncated': float32,
        'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
    }),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
obraz Obraz (Brak, Brak, 3) uint8
obraz/nazwa_pliku Tekst strunowy
obiekty Sekwencja
obiekty/alfa Napinacz pływak32 Kąt obserwacji obiektu, zakres [-pi..pi]
obiekty/bbox Funkcja BBox (4,) pływak32 Obwiednia 2D obiektu na obrazie
obiekty/wymiary Napinacz (3,) pływak32 Wymiary obiektu 3D: wysokość, szerokość, długość (w metrach)
obiekty/lokalizacja Napinacz (3,) pływak32 Lokalizacja obiektu 3D x,y,z we współrzędnych kamery (w metrach)
obiekty/przesłonięte Etykieta klasy int64 Liczba całkowita (0,1,2,3) wskazująca stan zatkania: 0 = w pełni widoczne, 1 = częściowo zasłonięte2 = w dużym stopniu zasłonięte, 3 = nieznane
obiekty/obrót_y Napinacz pływak32 Obrót ry wokół osi Y we współrzędnych kamery [-pi..pi]
obiekty/obcięte Napinacz pływak32 Przepływ od 0 (nieobcięty) do 1 (obcięty), gdzie obcięty odnosi się do obiektu opuszczającego granice obrazu
obiekty/typ Etykieta klasy int64 Typ obiektu, np. „Samochód” lub „Van”

Wyobrażanie sobie

  • Cytat :
@inproceedings{Geiger2012CVPR,
  author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
  title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
  booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
  year = {2012}
}