एमएल समुदाय दिवस 9 नवंबर है! TensorFlow, JAX से नई जानकारी के लिए हमसे जुड़ें, और अधिक जानें

सममित_ठोस

  • विवरण:

यह एक मुद्रा अनुमान डेटासेट है, जिसमें सममित 3D आकार होते हैं, जहां कई झुकाव नेत्रहीन अप्रभेद्य होते हैं। प्रशिक्षण के दौरान प्रत्येक छवि के साथ केवल एक अभिविन्यास जोड़े जाने पर सभी समकक्ष अभिविन्यासों की भविष्यवाणी करना चुनौती है (जैसा कि अधिकांश मुद्रा अनुमान डेटासेट के लिए परिदृश्य है)। अधिकांश मुद्रा अनुमान डेटासेट के विपरीत, समकक्ष अभिविन्यास का पूरा सेट मूल्यांकन के लिए उपलब्ध है।

कुल आठ आकृतियाँ हैं, जिनमें से प्रत्येक को ५०,००० दृष्टिकोणों से प्रस्तुत किया गया है, जो ३डी घुमावों के पूरे स्थान पर यादृच्छिक रूप से समान रूप से वितरित की गई हैं। पांच आकृतियाँ फीचर रहित हैं - टेट्राहेड्रोन, क्यूब, इकोसाहेड्रोन, शंकु और सिलेंडर। उनमें से, तीन प्लेटोनिक ठोस (टेट्राहेड्रॉन, क्यूब, आईकोसाहेड्रोन) को क्रमशः 12-, 24-, और 60-गुना असतत समरूपता के साथ एनोटेट किया जाता है। शंकु और सिलेंडर को 1 डिग्री के अंतराल पर उनकी निरंतर समरूपता के साथ एनोटेट किया जाता है। ये समरूपता मूल्यांकन के लिए प्रदान की जाती हैं; इच्छित पर्यवेक्षण प्रत्येक छवि के साथ केवल एक ही घुमाव है।

शेष तीन आकृतियों को एक विशिष्ट विशेषता के साथ चिह्नित किया गया है। एक चतुष्फलक होता है जिसमें एक लाल रंग का चेहरा होता है, एक ऑफ-सेंटर डॉट वाला एक सिलेंडर होता है, और एक गोलाकार होता है जिसमें एक बिंदु द्वारा छाया हुआ X होता है। विशिष्ठ विशेषता दिखाई दे रही है या नहीं, संभावित अभिविन्यासों का स्थान कम हो गया है। हम इन आकृतियों के लिए समतुल्य घुमावों का समुच्चय प्रदान नहीं करते हैं।

प्रत्येक उदाहरण में शामिल हैं:

  • 224x224 आरजीबी छवि
  • एक आकार सूचकांक ताकि डेटासेट को आकार के अनुसार फ़िल्टर किया जा सके।
    सूचकांक इसके अनुरूप हैं:

    • 0 = टेट्राहेड्रोन
    • 1 = घन
    • 2 = इकोसाहेड्रोन
    • 3 = शंकु
    • 4 = सिलेंडर
    • 5 = चिह्नित चतुष्फलक
    • 6 = चिह्नित सिलेंडर
    • 7 = चिह्नित क्षेत्र
  • रेंडरिंग प्रक्रिया में प्रयुक्त रोटेशन, 3x3 रोटेशन मैट्रिक्स के रूप में दर्शाया गया है

  • मूल्यांकन के लिए समरूपता के तहत ज्ञात समकक्ष घुमावों का सेट।

तीन चिह्नित आकृतियों के मामले में, यह केवल रेंडरिंग रोटेशन है।

विभाजित करना उदाहरण
'test' 40,000
'train' 360,000
  • विशेषताएं:
FeaturesDict({
    'image': Image(shape=(224, 224, 3), dtype=tf.uint8),
    'label_shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=8),
    'rotation': Tensor(shape=(3, 3), dtype=tf.float32),
    'rotations_equivalent': Tensor(shape=(None, 3, 3), dtype=tf.float32),
})

VISUALIZATION

  • प्रशस्ति पत्र:
@inproceedings{implicitpdf2021,
  title = {Implicit Representation of Probability Distributions on the Rotation
  Manifold},
  author = {Murphy, Kieran and Esteves, Carlos and Jampani, Varun and
  Ramalingam, Srikumar and Makadia, Ameesh}
  booktitle = {International Conference on Machine Learning}
  year = {2021}
}