Wizualizacja : Eksploruj w regionie Poznaj swoje dane
opis :
Kitti zawiera zestaw zadań wizyjnych zbudowanych przy użyciu platformy autonomicznej jazdy. Pełny test porównawczy zawiera wiele zadań, takich jak stereo, przepływ optyczny, wizualna odometria itp. Ten zestaw danych zawiera zestaw danych wykrywania obiektów, w tym obrazy monokularowe i obwiednie. Zbiór danych zawiera 7481 obrazów treningowych z adnotacjami za pomocą ramek ograniczających 3D. Pełny opis adnotacji można znaleźć w pliku readme zestawu do tworzenia obiektów na stronie domowej Kitti.
Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem
Strona domowa : http://www.cvlibs.net/datasets/kitti/
Kod źródłowy :
tfds.datasets.kitti.Builder
Wersje :
-
3.1.0
: Brak informacji o wydaniu. -
3.2.0
: Zaktualizowano Devkit. -
3.3.0
(domyślnie): Dodano etykiety dlaoccluded
funkcji.
-
Rozmiar pliku do pobrania :
11.71 GiB
Rozmiar zestawu danych :
5.27 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'test' | 711 |
'train' | 6347 |
'validation' | 423 |
- Struktura funkcji :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/file_name': Text(shape=(), dtype=string),
'objects': Sequence({
'alpha': float32,
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'dimensions': Tensor(shape=(3,), dtype=float32),
'location': Tensor(shape=(3,), dtype=float32),
'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
'rotation_y': float32,
'truncated': float32,
'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
obraz | Obraz | (Brak, Brak, 3) | uint8 | |
obraz/nazwa_pliku | Tekst | strunowy | ||
obiekty | Sekwencja | |||
obiekty/alfa | Napinacz | pływak32 | Kąt obserwacji obiektu, zakres [-pi..pi] | |
obiekty/bbox | Funkcja BBox | (4,) | pływak32 | Obwiednia 2D obiektu na obrazie |
obiekty/wymiary | Napinacz | (3,) | pływak32 | Wymiary obiektu 3D: wysokość, szerokość, długość (w metrach) |
obiekty/lokalizacja | Napinacz | (3,) | pływak32 | Lokalizacja obiektu 3D x,y,z we współrzędnych kamery (w metrach) |
obiekty/przesłonięte | Etykieta klasy | int64 | Liczba całkowita (0,1,2,3) wskazująca stan zatkania: 0 = w pełni widoczne, 1 = częściowo zasłonięte2 = w dużym stopniu zasłonięte, 3 = nieznane | |
obiekty/obrót_y | Napinacz | pływak32 | Obrót ry wokół osi Y we współrzędnych kamery [-pi..pi] | |
obiekty/obcięte | Napinacz | pływak32 | Przepływ od 0 (nieobcięty) do 1 (obcięty), gdzie obcięty odnosi się do obiektu opuszczającego granice obrazu | |
obiekty/typ | Etykieta klasy | int64 | Typ obiektu, np. „Samochód” lub „Van” |
Klucze nadzorowane (Zobacz dokument
as_supervised
):None
Rysunek ( tfds.show_examples ):
- Przykłady ( tfds.as_dataframe ):
- Cytat :
@inproceedings{Geiger2012CVPR,
author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
year = {2012}
}