सममित_ठोस, सममित_ठोस

  • विवरण :

यह एक पोज़ अनुमान डेटासेट है, जिसमें सममित 3डी आकृतियाँ शामिल हैं जहाँ कई ओरिएंटेशन दृष्टिगत रूप से अप्रभेद्य हैं। प्रशिक्षण के दौरान प्रत्येक छवि के साथ केवल एक अभिविन्यास जोड़े जाने पर सभी समतुल्य अभिविन्यासों की भविष्यवाणी करना चुनौती है (जैसा कि अधिकांश मुद्रा अनुमान डेटासेट के लिए परिदृश्य है)। अधिकांश पोज़ अनुमान डेटासेट के विपरीत, समतुल्य अभिविन्यास का पूरा सेट मूल्यांकन के लिए उपलब्ध है।

कुल आठ आकार हैं, प्रत्येक को 50,000 दृष्टिकोणों से प्रस्तुत किया गया है जो 3डी घुमावों के पूर्ण स्थान पर यादृच्छिक रूप से समान रूप से वितरित किए गए हैं। पाँच आकृतियाँ फ़ीचर रहित हैं - टेट्राहेड्रॉन, क्यूब, आईकोसैहेड्रॉन, शंकु और बेलन। उनमें से, तीन प्लेटोनिक ठोस (टेट्राहेड्रॉन, क्यूब, आईकोसैहेड्रोन) क्रमशः 12-, 24-, और 60-गुना असतत समरूपता के साथ एनोटेट किए जाते हैं। शंकु और सिलेंडर को उनके निरंतर समरूपता के साथ 1 डिग्री के अंतराल पर विखंडित किया जाता है। ये समरूपता मूल्यांकन के लिए प्रदान की जाती हैं; इच्छित पर्यवेक्षण प्रत्येक छवि के साथ केवल एक घुमाव है।

शेष तीन आकृतियों को एक विशिष्ट विशेषता के साथ चिह्नित किया गया है। एक टेट्राहेड्रॉन है जिसमें एक लाल रंग का चेहरा है, एक ऑफ-सेंटर डॉट वाला एक सिलेंडर है, और एक एक्स के साथ एक डॉट द्वारा कैप किया गया है। विशिष्ट विशेषता दिखाई देती है या नहीं, संभावित अभिविन्यासों का स्थान कम हो जाता है। हम इन आकृतियों के लिए समतुल्य घुमावों का सेट प्रदान नहीं करते हैं।

प्रत्येक उदाहरण में शामिल हैं

  • 224x224 आरजीबी छवि
  • आकार अनुक्रमणिका ताकि डेटासेट को आकृति द्वारा फ़िल्टर किया जा सके।
    सूचकांक इसके अनुरूप हैं:

    • 0 = चतुष्फलक
    • 1 = घन
    • 2 = आईकोसैहेड्रोन
    • 3 = कोन
    • 4 = सिलेंडर
    • 5 = चिन्हित चतुष्फलक
    • 6 = चिह्नित सिलेंडर
    • 7 = चिह्नित क्षेत्र
  • रेंडरिंग प्रक्रिया में प्रयुक्त रोटेशन, जिसे 3x3 रोटेशन मैट्रिक्स के रूप में दर्शाया गया है

  • समरूपता के तहत ज्ञात समतुल्य घुमावों का सेट, मूल्यांकन के लिए।

तीन चिह्नित आकृतियों के मामले में, यह केवल रेंडरिंग रोटेशन है।

विभाजित करना उदाहरण
'test' 40,000
'train' 360,000
  • फ़ीचर संरचना :
FeaturesDict({
    'image': Image(shape=(224, 224, 3), dtype=uint8),
    'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=8),
    'rotation': Tensor(shape=(3, 3), dtype=float32),
    'rotations_equivalent': Tensor(shape=(None, 3, 3), dtype=float32),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
छवि छवि (224, 224, 3) uint8
लेबल_आकार क्लासलेबल int64
रोटेशन टेन्सर (3, 3) फ्लोट32
घुमाव_समतुल्य टेन्सर (कोई नहीं, 3, 3) फ्लोट32

VISUALIZATION

  • उद्धरण :
@inproceedings{implicitpdf2021,
  title = {Implicit Representation of Probability Distributions on the Rotation
  Manifold},
  author = {Murphy, Kieran and Esteves, Carlos and Jampani, Varun and
  Ramalingam, Srikumar and Makadia, Ameesh}
  booktitle = {International Conference on Machine Learning}
  year = {2021}
}