dmlab

L'ensemble de données Dmlab contient des cadres observés par l'agent agissant dans l'environnement DeepMind Lab, qui sont annotés par la distance entre l'agent et divers objets présents dans l'environnement. L'objectif est d'évaluer la capacité d'un modèle visuel à raisonner sur les distances par rapport à l'entrée visuelle dans des environnements 3D. L'ensemble de données Dmlab se compose d'images couleur 360x480 en 6 classes. Les classes sont {proche, loin, très loin} x {récompense positive, récompense négative} respectivement.

Diviser Exemples
'test' 22 735
'train' 65 550
'validation' 22 628
  • Caractéristiques:
FeaturesDict({
    'filename': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(360, 480, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
})

Visualisation

  • citation:
@article{zhai2019visual,
        title={The Visual Task Adaptation Benchmark},
        author={Xiaohua Zhai and Joan Puigcerver and Alexander Kolesnikov and
               Pierre Ruyssen and Carlos Riquelme and Mario Lucic and
               Josip Djolonga and Andre Susano Pinto and Maxim Neumann and
               Alexey Dosovitskiy and Lucas Beyer and Olivier Bachem and
               Michael Tschannen and Marcin Michalski and Olivier Bousquet and
               Sylvain Gelly and Neil Houlsby},
                              year={2019},
                              eprint={1910.04867},
                              archivePrefix={arXiv},
                              primaryClass={cs.CV},
                              url = {https://arxiv.org/abs/1910.04867}
                          }