Dsprit'ler

  • Tanım :

dSprites, temel gerçeklikten bağımsız 6 gizli faktörden prosedürel olarak oluşturulan 2 boyutlu şekillerden oluşan bir veri kümesidir. Bu faktörler bir hareketli grafiğin rengi , şekli , ölçeği , dönüşü , x ve y konumlarıdır.

Bu gizli öğelerin tüm olası kombinasyonları tam olarak bir kez mevcut olup N = 737280 toplam görüntü oluşturulur.

Gizli faktör değerleri

  • Beyaz renk
  • Şekil: kare, elips, kalp
  • Ölçek: [0,5, 1] ​​aralığında doğrusal olarak aralıklı 6 değer
  • Yön: [0, 2 pi] cinsinden 40 değer
  • X Konumu: [0, 1]'de 32 değer
  • Y Konumu: [0, 1]'de 32 değer

Her seferinde gizli olanı değiştirdik (Y Konumundan başlayarak, ardından X Konumundan vb. başlayarak) ve görüntüleri sabit sırayla sırayla depoladık. Bu nedenle, ilk boyut boyunca sıra sabittir ve o görüntüye karşılık gelen gizli değerlerin değerine geri eşleme yapmanıza olanak tanır.

Tüm piksel çıktılarının farklı olmasını sağlarken gizli değerleri en küçük adım değişikliklerine sahip olacak şekilde bilinçli olarak seçtik. Gürültü eklenmedi.

Bölmek Örnekler
'train' 737.280
  • Özellik yapısı :
FeaturesDict({
    'image': Image(shape=(64, 64, 1), dtype=uint8),
    'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=40),
    'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'label_x_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
    'label_y_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
    'value_orientation': float32,
    'value_scale': float32,
    'value_shape': float32,
    'value_x_position': float32,
    'value_y_position': float32,
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
görüntü Resim (64, 64, 1) uint8
label_orientation SınıfEtiketi int64
label_scale SınıfEtiketi int64
etiket_şekli SınıfEtiketi int64
label_x_position SınıfEtiketi int64
label_y_position SınıfEtiketi int64
Değer oryantasyonu Tensör kayan nokta32
değer_ölçeği Tensör kayan nokta32
değer_şekli Tensör kayan nokta32
değer_x_konumu Tensör kayan nokta32
value_y_position Tensör kayan nokta32

Görselleştirme

  • Alıntı :
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}