Görselleştirme : Verilerinizi keşfedin
Açıklama :
dSprites, 6 zemin gerçeğinden bağımsız gizli faktörden prosedürel olarak oluşturulan 2B şekillerin bir veri kümesidir. Bu faktörler bir karakterin rengi , şekli , ölçeği , dönüşü , x ve y konumlarıdır.
Bu gizli nesnelerin tüm olası kombinasyonları tam olarak bir kez bulunur ve toplam N = 737280 görüntü oluşturur.
gizli faktör değerleri
- Beyaz renk
- Şekil: kare, elips, kalp
- Ölçek: [0.5, 1]'de lineer aralıklı 6 değer
- Oryantasyon: [0, 2 pi] cinsinden 40 değer
- Konum X: [0, 1]'de 32 değer
- Konum Y: [0, 1]'de 32 değer
Her seferinde bir gizli değişkeni değiştirdik (Y Konumundan, ardından X Konumundan başlayarak, vb.) ve görüntüleri sabit sırayla sırayla sakladık. Bu nedenle, birinci boyut boyunca sıra sabittir ve o görüntüye karşılık gelen gizli değerlerin değerine geri haritalamanıza izin verir.
Tüm piksel çıktılarının farklı olmasını sağlarken en küçük adım değişikliklerine sahip olmak için gizli değerleri kasıtlı olarak seçtik. Gürültü eklenmedi.
Ana sayfa : https://github.com/deepmind/dsprites-dataset
Kaynak kodu :
tfds.datasets.dsprites.Builder
sürümler :
-
2.0.0
(varsayılan): Yeni bölünmüş API ( https://tensorflow.org/datasets/splits ) -
2.1.0
: Sürüm notu yok.
-
İndirme boyutu :
26.73 MiB
Veri kümesi boyutu :
Unknown size
Otomatik önbelleğe alınmış ( belgeler ): Bilinmiyor
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 737.280 |
- Özellik yapısı :
FeaturesDict({
'image': Image(shape=(64, 64, 1), dtype=uint8),
'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=40),
'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=6),
'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
'label_x_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
'label_y_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
'value_orientation': float32,
'value_scale': float32,
'value_shape': float32,
'value_x_position': float32,
'value_y_position': float32,
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
resim | resim | (64, 64, 1) | uint8 | |
etiket_oryantasyon | SınıfEtiketi | int64 | ||
etiket_ölçeği | SınıfEtiketi | int64 | ||
etiket_şekli | SınıfEtiketi | int64 | ||
etiket_x_konumu | SınıfEtiketi | int64 | ||
etiket_y_konumu | SınıfEtiketi | int64 | ||
Değer oryantasyonu | tensör | şamandıra32 | ||
değer_ölçeği | tensör | şamandıra32 | ||
değer_şekli | tensör | şamandıra32 | ||
değer_x_konumu | tensör | şamandıra32 | ||
değer_y_konumu | tensör | şamandıra32 |
Denetlenen anahtarlar (Bkz
as_supervised
doc ):None
Şekil ( tfds.show_examples ):
- Örnekler ( tfds.as_dataframe ):
- Alıntı :
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}