O Dia da Comunidade de ML é dia 9 de novembro! Junte-nos para atualização de TensorFlow, JAX, e mais Saiba mais

dsprites

dSprites é um conjunto de dados de formas 2D gerado processualmente a partir de 6 fatores latentes independentes de verdade terrestre. Estes factores são de cor, forma, dimensão, rotação, posições x e y de um sprite.

Todas as combinações possíveis dessas latentes estão presentes exatamente uma vez, gerando N = 737280 imagens no total.

Valores de fator latente

  • Cor branca
  • Forma: quadrado, elipse, coração
  • Escala: 6 valores espaçados linearmente em [0,5, 1]
  • Orientação: 40 valores em [0, 2 pi]
  • Posição X: 32 valores em [0, 1]
  • Posição Y: 32 valores em [0, 1]

Variamos uma latente de cada vez (começando na posição Y, depois na posição X etc.) e armazenamos sequencialmente as imagens em ordem fixa. Portanto, a ordem ao longo da primeira dimensão é fixa e permite mapear de volta o valor das latentes correspondentes a essa imagem.

Escolhemos os valores latentes deliberadamente para ter as menores mudanças de etapa, garantindo que todas as saídas de pixel fossem diferentes. Nenhum ruído foi adicionado.

Dividir Exemplos
'train' 737.280
  • Características:
FeaturesDict({
    'image': Image(shape=(64, 64, 1), dtype=tf.uint8),
    'label_orientation': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
    'label_scale': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    'label_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'label_x_position': ClassLabel(shape=(), dtype=tf.int64, num_classes=32),
    'label_y_position': ClassLabel(shape=(), dtype=tf.int64, num_classes=32),
    'value_orientation': tf.float32,
    'value_scale': tf.float32,
    'value_shape': tf.float32,
    'value_x_position': tf.float32,
    'value_y_position': tf.float32,
})

Visualização

  • citação:
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}