O Dia da Comunidade de ML é dia 9 de novembro! Junte-nos para atualização de TensorFlow, JAX, e mais Saiba mais

gatinho

Kitti contém um conjunto de tarefas de visão construídas usando uma plataforma de direção autônoma. O benchmark completo contém muitas tarefas, como estéreo, fluxo óptico, odometria visual, etc. Este conjunto de dados contém o conjunto de dados de detecção de objetos, incluindo as imagens monoculares e caixas delimitadoras. O conjunto de dados contém 7481 imagens de treinamento anotadas com caixas delimitadoras 3D. Uma descrição completa das anotações pode ser encontrada no leia-me do kit de desenvolvimento de objetos na página inicial do Kitti.

Dividir Exemplos
'test' 711
'train' 6.347
'validation' 423
  • Características:
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'image/file_name': Text(shape=(), dtype=tf.string),
    'objects': Sequence({
        'alpha': tf.float32,
        'bbox': BBoxFeature(shape=(4,), dtype=tf.float32),
        'dimensions': Tensor(shape=(3,), dtype=tf.float32),
        'location': Tensor(shape=(3,), dtype=tf.float32),
        'occluded': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
        'rotation_y': tf.float32,
        'truncated': tf.float32,
        'type': ClassLabel(shape=(), dtype=tf.int64, num_classes=8),
    }),
})

Visualização

  • citação:
@inproceedings{Geiger2012CVPR,
  author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
  title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
  booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
  year = {2012}
}