waymo_open_dataset

Bộ dữ liệu mở Waymo bao gồm dữ liệu cảm biến có độ phân giải cao do xe tự lái Waymo thu thập trong nhiều điều kiện khác nhau. Dữ liệu này được cấp phép cho mục đích sử dụng phi thương mại.

FeaturesDict({
    'camera_FRONT': FeaturesDict({
        'image': Image(shape=(1280, 1920, 3), dtype=uint8),
        'labels': Sequence({
            'bbox': BBoxFeature(shape=(4,), dtype=float32),
            'type': ClassLabel(shape=(), dtype=int64, num_classes=5),
        }),
    }),
    'camera_FRONT_LEFT': FeaturesDict({
        'image': Image(shape=(1280, 1920, 3), dtype=uint8),
        'labels': Sequence({
            'bbox': BBoxFeature(shape=(4,), dtype=float32),
            'type': ClassLabel(shape=(), dtype=int64, num_classes=5),
        }),
    }),
    'camera_FRONT_RIGHT': FeaturesDict({
        'image': Image(shape=(1280, 1920, 3), dtype=uint8),
        'labels': Sequence({
            'bbox': BBoxFeature(shape=(4,), dtype=float32),
            'type': ClassLabel(shape=(), dtype=int64, num_classes=5),
        }),
    }),
    'camera_SIDE_LEFT': FeaturesDict({
        'image': Image(shape=(886, 1920, 3), dtype=uint8),
        'labels': Sequence({
            'bbox': BBoxFeature(shape=(4,), dtype=float32),
            'type': ClassLabel(shape=(), dtype=int64, num_classes=5),
        }),
    }),
    'camera_SIDE_RIGHT': FeaturesDict({
        'image': Image(shape=(886, 1920, 3), dtype=uint8),
        'labels': Sequence({
            'bbox': BBoxFeature(shape=(4,), dtype=float32),
            'type': ClassLabel(shape=(), dtype=int64, num_classes=5),
        }),
    }),
    'context': FeaturesDict({
        'name': Text(shape=(), dtype=string),
    }),
    'timestamp_micros': int64,
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
camera_FRONT Tính năngDict
camera_FRONT/hình ảnh Hình ảnh (1280, 1920, 3) uint8
camera_FRONT/nhãn Sự phối hợp
camera_FRONT/nhãn/bbox Tính năng BBox (4,) phao32
camera_FRONT/nhãn/loại LớpNhãn int64
máy ảnh_FRONT_LEFT Tính năngDict
camera_FRONT_LEFT/hình ảnh Hình ảnh (1280, 1920, 3) uint8
camera_FRONT_LEFT/nhãn Sự phối hợp
camera_FRONT_LEFT/nhãn/bbox Tính năng BBox (4,) phao32
camera_FRONT_LEFT/nhãn/loại LớpNhãn int64
máy ảnh_FRONT_RIGHT Tính năngDict
camera_FRONT_RIGHT/hình ảnh Hình ảnh (1280, 1920, 3) uint8
camera_FRONT_RIGHT/nhãn Sự phối hợp
camera_FRONT_RIGHT/nhãn/bbox Tính năng BBox (4,) phao32
camera_FRONT_RIGHT/nhãn/loại LớpNhãn int64
máy ảnh_SIDE_LEFT Tính năngDict
camera_SIDE_LEFT/hình ảnh Hình ảnh (886, 1920, 3) uint8
camera_SIDE_LEFT/nhãn Sự phối hợp
camera_SIDE_LEFT/nhãn/bbox Tính năng BBox (4,) phao32
camera_SIDE_LEFT/nhãn/loại LớpNhãn int64
máy ảnh_SIDE_RIGHT Tính năngDict
camera_SIDE_RIGHT/hình ảnh Hình ảnh (886, 1920, 3) uint8
camera_SIDE_RIGHT/nhãn Sự phối hợp
camera_SIDE_RIGHT/nhãn/bbox Tính năng BBox (4,) phao32
camera_SIDE_RIGHT/nhãn/loại LớpNhãn int64
định nghĩa bài văn Tính năngDict
ngữ cảnh/tên Chữ sợi dây
dấu thời gian_micros tenxơ int64
@InProceedings{Sun_2020_CVPR,
author = {Sun, Pei and Kretzschmar, Henrik and Dotiwalla, Xerxes and Chouard, Aurelien and Patnaik, Vijaysai and Tsui, Paul and Guo, James and Zhou, Yin and Chai, Yuning and Caine, Benjamin and Vasudevan, Vijay and Han, Wei and Ngiam, Jiquan and Zhao, Hang and Timofeev, Aleksei and Ettinger, Scott and Krivokon, Maxim and Gao, Amy and Joshi, Aditya and Zhang, Yu and Shlens, Jonathon and Chen, Zhifeng and Anguelov, Dragomir},
title = {Scalability in Perception for Autonomous Driving: Waymo Open Dataset},
booktitle = {The IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)},
month = {June},
year = {2020}
}

waymo_open_dataset/v1.2 (cấu hình mặc định)

  • Mô tả cấu hình : Waymo Open Dataset v1.2

  • Kích thước tập dữ liệu : 336.62 GiB

  • Chia tách :

Tách ra ví dụ
'train' 158,081
'validation' 39,987

waymo_open_dataset/v1.1

  • Mô tả cấu hình : Waymo Open Dataset v1.1

  • Kích thước tập dữ liệu : 336.62 GiB

  • Chia tách :

Tách ra ví dụ
'train' 158,081
'validation' 39,987

waymo_open_dataset/v1.0

  • Mô tả cấu hình : Waymo Open Dataset v1.0 Tập dữ liệu này cũng có sẵn ở định dạng được xử lý trước, giúp tải nhanh hơn, nếu bạn chọn đúng data_dir:
tfds.load('waymo_open_dataset/v1.0', data_dir='gs://waymo_open_dataset_v_1_0_0_individual_files/tensorflow_datasets')
  • Kích thước tập dữ liệu : 34.73 GiB

  • Chia tách :

Tách ra ví dụ
'train' 14,884
'validation' 4,954