¡El Día de la Comunidad de ML es el 9 de noviembre! Únase a nosotros para recibir actualizaciones de TensorFlow, JAX, y más Más información

dmlab

El conjunto de datos de Dmlab contiene marcos observados por el agente que actúa en el entorno de DeepMind Lab, que están anotados por la distancia entre el agente y varios objetos presentes en el entorno. El objetivo es evaluar la capacidad de un modelo visual para razonar sobre las distancias desde la entrada visual en entornos 3D. El conjunto de datos de Dmlab consta de imágenes en color de 360x480 en 6 clases. Las clases son {cerca, lejos, muy lejos} x {recompensa positiva, recompensa negativa} respectivamente.

Separar Ejemplos de
'test' 22,735
'train' 65,550
'validation' 22,628
  • características:
FeaturesDict({
    'filename': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(360, 480, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
})

Visualización

  • Cita:
@article{zhai2019visual,
        title={The Visual Task Adaptation Benchmark},
        author={Xiaohua Zhai and Joan Puigcerver and Alexander Kolesnikov and
               Pierre Ruyssen and Carlos Riquelme and Mario Lucic and
               Josip Djolonga and Andre Susano Pinto and Maxim Neumann and
               Alexey Dosovitskiy and Lucas Beyer and Olivier Bachem and
               Michael Tschannen and Marcin Michalski and Olivier Bousquet and
               Sylvain Gelly and Neil Houlsby},
                              year={2019},
                              eprint={1910.04867},
                              archivePrefix={arXiv},
                              primaryClass={cs.CV},
                              url = {https://arxiv.org/abs/1910.04867}
                          }