RSVP для вашего местного мероприятия TensorFlow Everywhere сегодня!
Эта страница переведена с помощью Cloud Translation API.
Switch to English

dsprites

  • Описание :

dSprites - это набор данных двумерных фигур, процедурно сгенерированных из 6 скрытых факторов, не зависящих от достоверности фактов. Этими факторами являются цвет , форма , масштаб , поворот , положение спрайта по осям x и y .

Все возможные комбинации этих скрытых явлений присутствуют ровно один раз, создавая N = 737280 изображений.

Значения скрытого фактора

  • Белый цвет
  • Форма: квадрат, эллипс, сердце
  • Масштаб: 6 значений с линейным интервалом [0,5, 1]
  • Ориентация: 40 значений в [0, 2 пи]
  • Позиция X: 32 значения в [0, 1]
  • Позиция Y: 32 значения в [0, 1]

Мы варьировали по одному скрытому (начиная с позиции Y, затем позиции X и т. Д.) И последовательно сохраняли изображения в фиксированном порядке. Следовательно, порядок по первому измерению фиксирован и позволяет отображать обратно значение скрытых значений, соответствующее этому изображению.

Мы сознательно выбрали значения латентности, чтобы иметь наименьшие изменения шага, обеспечивая при этом, чтобы все выходные пиксели были разными. Шума не было.

Трещина Примеры
'train' 737 280
  • Особенности :
FeaturesDict({
    'image': Image(shape=(64, 64, 1), dtype=tf.uint8),
    'label_orientation': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
    'label_scale': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    'label_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'label_x_position': ClassLabel(shape=(), dtype=tf.int64, num_classes=32),
    'label_y_position': ClassLabel(shape=(), dtype=tf.int64, num_classes=32),
    'value_orientation': tf.float32,
    'value_scale': tf.float32,
    'value_shape': tf.float32,
    'value_x_position': tf.float32,
    'value_y_position': tf.float32,
})
  • Контролируемые ключи (см. as_supervised doc ): None

  • Цитата :

@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}

Визуализация