dsprites

dSprites — это набор данных 2D-форм, процедурно сгенерированных из 6 независимых скрытых факторов. Этими факторами являются цвет , форма , масштаб , вращение , координаты x и y спрайта.

Все возможные комбинации этих латентных изображений присутствуют ровно один раз, что дает всего N = 737280 изображений.

Скрытые значения фактора

  • Белый цвет
  • Форма: квадрат, эллипс, сердце
  • Масштаб: 6 значений, линейно расположенных в [0,5, 1]
  • Ориентация: 40 значений в [0, 2 pi]
  • Позиция X: 32 значения в [0, 1]
  • Позиция Y: 32 значения в [0, 1]

Мы меняли по одному скрытому за раз (начиная с позиции Y, затем позиции X и т. д.) и последовательно сохраняли изображения в фиксированном порядке. Следовательно, порядок по первому измерению фиксирован и позволяет вам сопоставить обратно значение скрытых значений, соответствующих этому изображению.

Мы намеренно выбрали латентные значения, чтобы иметь наименьшие ступенчатые изменения, гарантируя, что все выходные данные пикселей будут разными. Шум не добавлялся.

Расколоть Примеры
'train' 737 280
  • Структура функции :
FeaturesDict({
    'image': Image(shape=(64, 64, 1), dtype=uint8),
    'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=40),
    'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'label_x_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
    'label_y_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
    'value_orientation': float32,
    'value_scale': float32,
    'value_shape': float32,
    'value_x_position': float32,
    'value_y_position': float32,
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
изображение Изображение (64, 64, 1) uint8
метка_ориентация Метка класса int64
label_scale Метка класса int64
label_shape Метка класса int64
label_x_position Метка класса int64
label_y_position Метка класса int64
ценностная_ориентация Тензор поплавок32
value_scale Тензор поплавок32
значение_форма Тензор поплавок32
значение_x_позиция Тензор поплавок32
value_y_position Тензор поплавок32

Визуализация

  • Цитата :
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}