дмлаб

Набор данных Dmlab содержит кадры, наблюдаемые агентом, действующим в среде DeepMind Lab, которые аннотируются расстоянием между агентом и различными объектами, присутствующими в среде. Цель состоит в том, чтобы оценить способность визуальной модели рассуждать о расстояниях от визуального ввода в трехмерной среде. Набор данных Dmlab состоит из цветных изображений 360x480 в 6 классах. Классы {близко, далеко, очень далеко} x {положительное вознаграждение, отрицательное вознаграждение} соответственно.

Расколоть Примеры
'test' 22 735
'train' 65 550
'validation' 22 628
  • Структура функции :
FeaturesDict({
    'filename': Text(shape=(), dtype=string),
    'image': Image(shape=(360, 480, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
имя файла Текст нить
изображение Изображение (360, 480, 3) uint8
этикетка Метка класса int64

Визуализация

  • Цитата :
@article{zhai2019visual,
        title={The Visual Task Adaptation Benchmark},
        author={Xiaohua Zhai and Joan Puigcerver and Alexander Kolesnikov and
               Pierre Ruyssen and Carlos Riquelme and Mario Lucic and
               Josip Djolonga and Andre Susano Pinto and Maxim Neumann and
               Alexey Dosovitskiy and Lucas Beyer and Olivier Bachem and
               Michael Tschannen and Marcin Michalski and Olivier Bousquet and
               Sylvain Gelly and Neil Houlsby},
                              year={2019},
                              eprint={1910.04867},
                              archivePrefix={arXiv},
                              primaryClass={cs.CV},
                              url = {https://arxiv.org/abs/1910.04867}
                          }