dSprites 6 जमीनी सच्चाई से स्वतंत्र अव्यक्त कारकों से प्रक्रियात्मक रूप से उत्पन्न 2D आकृतियों का एक डेटासेट है। ये कारक स्प्राइट के रंग , आकार , स्केल , रोटेशन , एक्स और वाई स्थिति हैं।
इन अव्यक्तों के सभी संभावित संयोजन ठीक एक बार मौजूद होते हैं, जिससे N = 737280 कुल चित्र बनते हैं।
अव्यक्त कारक मान
- रंग सफेद
- आकार: वर्ग, दीर्घवृत्त, हृदय
- पैमाना: [0.5, 1] में रैखिक रूप से 6 मान
- अभिविन्यास: [0, 2 पाई] में 40 मान
- स्थिति X: 32 मान [0, 1] में
- स्थिति Y: 32 मान [0, 1] में
हम एक समय में एक अव्यक्त को बदलते हैं (स्थिति Y से शुरू करते हुए, फिर स्थिति X, आदि), और क्रमिक रूप से छवियों को निश्चित क्रम में संग्रहीत करते हैं। इसलिए पहले आयाम के साथ क्रम तय हो गया है और आपको उस छवि के अनुरूप लेटेंट्स के मूल्य पर वापस मैप करने की अनुमति मिलती है।
हमने यह सुनिश्चित करते हुए कि सभी पिक्सेल आउटपुट अलग-अलग थे, यह सुनिश्चित करते हुए जानबूझकर सबसे छोटे चरण परिवर्तन करने के लिए अव्यक्त मूल्यों को चुना। कोई शोर नहीं जोड़ा गया।
स्रोत कोड :
tfds.datasets.dsprites.Builder
संस्करण :
-
2.0.0
(डिफ़ॉल्ट): नया स्प्लिट एपीआई ( https://tensorflow.org/datasets/splits ) -
2.1.0
: कोई रिलीज नोट नहीं।
-
डाउनलोड का आकार :
26.73 MiB
डेटासेट का आकार :
Unknown size
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): अज्ञात
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 737,280 |
- फ़ीचर संरचना :
FeaturesDict({
'image': Image(shape=(64, 64, 1), dtype=uint8),
'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=40),
'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=6),
'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
'label_x_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
'label_y_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
'value_orientation': float32,
'value_scale': float32,
'value_shape': float32,
'value_x_position': float32,
'value_y_position': float32,
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
छवि | छवि | (64, 64, 1) | uint8 | |
label_orientation | क्लासलेबल | int64 | ||
लेबल_स्केल | क्लासलेबल | int64 | ||
लेबल_आकार | क्लासलेबल | int64 | ||
लेबल_x_स्थिति | क्लासलेबल | int64 | ||
लेबल_y_स्थिति | क्लासलेबल | int64 | ||
value_orientation | टेन्सर | फ्लोट32 | ||
value_scale | टेन्सर | फ्लोट32 | ||
value_shape | टेन्सर | फ्लोट32 | ||
मान_x_स्थिति | टेन्सर | फ्लोट32 | ||
value_y_position | टेन्सर | फ्लोट32 |
पर्यवेक्षित कुंजियाँ (
as_supervised
doc देखें):None
चित्र ( tfds.show_examples ):
- उदाहरण ( tfds.as_dataframe ):
- उद्धरण :
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}