डीस्प्राइट्स

dSprites 6 जमीनी सच्चाई से स्वतंत्र अव्यक्त कारकों से प्रक्रियात्मक रूप से उत्पन्न 2D आकृतियों का एक डेटासेट है। ये कारक स्प्राइट के रंग , आकार , स्केल , रोटेशन , एक्स और वाई स्थिति हैं।

इन अव्यक्तों के सभी संभावित संयोजन ठीक एक बार मौजूद होते हैं, जिससे N = 737280 कुल चित्र बनते हैं।

अव्यक्त कारक मान

  • रंग सफेद
  • आकार: वर्ग, दीर्घवृत्त, हृदय
  • पैमाना: [0.5, 1] ​​में रैखिक रूप से 6 मान
  • अभिविन्यास: [0, 2 पाई] में 40 मान
  • स्थिति X: 32 मान [0, 1] में
  • स्थिति Y: 32 मान [0, 1] में

हम एक समय में एक अव्यक्त को बदलते हैं (स्थिति Y से शुरू करते हुए, फिर स्थिति X, आदि), और क्रमिक रूप से छवियों को निश्चित क्रम में संग्रहीत करते हैं। इसलिए पहले आयाम के साथ क्रम तय हो गया है और आपको उस छवि के अनुरूप लेटेंट्स के मूल्य पर वापस मैप करने की अनुमति मिलती है।

हमने यह सुनिश्चित करते हुए कि सभी पिक्सेल आउटपुट अलग-अलग थे, यह सुनिश्चित करते हुए जानबूझकर सबसे छोटे चरण परिवर्तन करने के लिए अव्यक्त मूल्यों को चुना। कोई शोर नहीं जोड़ा गया।

विभाजित करना उदाहरण
'train' 737,280
  • फ़ीचर संरचना :
FeaturesDict({
    'image': Image(shape=(64, 64, 1), dtype=uint8),
    'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=40),
    'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'label_x_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
    'label_y_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
    'value_orientation': float32,
    'value_scale': float32,
    'value_shape': float32,
    'value_x_position': float32,
    'value_y_position': float32,
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
छवि छवि (64, 64, 1) uint8
label_orientation क्लासलेबल int64
लेबल_स्केल क्लासलेबल int64
लेबल_आकार क्लासलेबल int64
लेबल_x_स्थिति क्लासलेबल int64
लेबल_y_स्थिति क्लासलेबल int64
value_orientation टेन्सर फ्लोट32
value_scale टेन्सर फ्लोट32
value_shape टेन्सर फ्लोट32
मान_x_स्थिति टेन्सर फ्लोट32
value_y_position टेन्सर फ्लोट32

VISUALIZATION

  • उद्धरण :
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}