Questa pagina è stata tradotta dall'API Cloud Translation.
Switch to English

dsprites

  • Descrizione :

dSprites è un set di dati di forme 2D generate proceduralmente da 6 fattori latenti indipendenti dalla verità di base. Questi fattori sono colore, forma, dimensioni, rotazione, posizioni X e Y di uno sprite.

Tutte le possibili combinazioni di questi latenti sono presenti esattamente una volta, generando N = 737280 immagini totali.

Valori del fattore latente

  • Colore bianco
  • Forma: quadrata, ellisse, cuore
  • Scala: 6 valori spaziati linearmente in [0,5, 1]
  • Orientamento: 40 valori in [0, 2 pi]
  • Posizione X: 32 valori in [0, 1]
  • Posizione Y: 32 valori in [0, 1]

Abbiamo variato uno alla volta (partendo dalla posizione Y, quindi dalla posizione X, ecc.) E abbiamo memorizzato sequenzialmente le immagini in ordine fisso. Quindi l'ordine lungo la prima dimensione è fisso e consente di mappare nuovamente il valore dei latenti corrispondenti a quell'immagine.

Abbiamo scelto deliberatamente i valori di latenza per avere i più piccoli cambi di passo assicurando che tutti gli output dei pixel fossero diversi. Non è stato aggiunto alcun rumore.

Diviso Esempi
'train' 737.280
  • Caratteristiche :
 FeaturesDict({
    'image': Image(shape=(64, 64, 1), dtype=tf.uint8),
    'label_orientation': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
    'label_scale': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    'label_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'label_x_position': ClassLabel(shape=(), dtype=tf.int64, num_classes=32),
    'label_y_position': ClassLabel(shape=(), dtype=tf.int64, num_classes=32),
    'value_orientation': tf.float32,
    'value_scale': tf.float32,
    'value_shape': tf.float32,
    'value_x_position': tf.float32,
    'value_y_position': tf.float32,
})
 
 @misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}
 

visualizzazione