dsprites

dSprites, 6 zemin gerçeğinden bağımsız gizli faktörden prosedürel olarak oluşturulan 2B şekillerin bir veri kümesidir. Bu faktörler bir karakterin rengi , şekli , ölçeği , dönüşü , x ve y konumlarıdır.

Bu gizli nesnelerin tüm olası kombinasyonları tam olarak bir kez bulunur ve toplam N = 737280 görüntü oluşturur.

gizli faktör değerleri

  • Beyaz renk
  • Şekil: kare, elips, kalp
  • Ölçek: [0.5, 1]'de lineer aralıklı 6 değer
  • Oryantasyon: [0, 2 pi] cinsinden 40 değer
  • Konum X: [0, 1]'de 32 değer
  • Konum Y: [0, 1]'de 32 değer

Her seferinde bir gizli değişkeni değiştirdik (Y Konumundan, ardından X Konumundan başlayarak, vb.) ve görüntüleri sabit sırayla sırayla sakladık. Bu nedenle, birinci boyut boyunca sıra sabittir ve o görüntüye karşılık gelen gizli değerlerin değerine geri haritalamanıza izin verir.

Tüm piksel çıktılarının farklı olmasını sağlarken en küçük adım değişikliklerine sahip olmak için gizli değerleri kasıtlı olarak seçtik. Gürültü eklenmedi.

Bölmek örnekler
'train' 737.280
  • Özellik yapısı :
FeaturesDict({
    'image': Image(shape=(64, 64, 1), dtype=uint8),
    'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=40),
    'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'label_x_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
    'label_y_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
    'value_orientation': float32,
    'value_scale': float32,
    'value_shape': float32,
    'value_x_position': float32,
    'value_y_position': float32,
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
resim resim (64, 64, 1) uint8
etiket_oryantasyon SınıfEtiketi int64
etiket_ölçeği SınıfEtiketi int64
etiket_şekli SınıfEtiketi int64
etiket_x_konumu SınıfEtiketi int64
etiket_y_konumu SınıfEtiketi int64
Değer oryantasyonu tensör şamandıra32
değer_ölçeği tensör şamandıra32
değer_şekli tensör şamandıra32
değer_x_konumu tensör şamandıra32
değer_y_konumu tensör şamandıra32

görselleştirme

  • Alıntı :
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}