एमएल समुदाय दिवस 9 नवंबर है! TensorFlow, JAX से नई जानकारी के लिए हमसे जुड़ें, और अधिक जानें

s3o4d

डाटासेट पहले में वर्णित कागज की धारा "स्टैनफोर्ड 3 डी वस्तुओं" उपस्पेस प्रसार से अलग करने । डेटा 100,000 प्रतिपादन से बनी और ड्रैगन वस्तुओं में से प्रत्येक के होते हैं स्टैनफोर्ड 3 डी स्कैनिंग भंडार । भविष्य में और वस्तुओं को जोड़ा जा सकता है, लेकिन कागज में केवल बनी और ड्रैगन का उपयोग किया जाता है। प्रत्येक वस्तु को 2-गोले पर एक बिंदु से एक समान रूप से नमूना रोशनी के साथ प्रदान किया जाता है, और एक समान रूप से नमूना 3 डी रोटेशन। वास्तविक अव्यक्त अवस्थाएँ छवियों के साथ NumPy सरणियों के रूप में प्रदान की जाती हैं। प्रकाश को इकाई मानक के साथ 3-वेक्टर के रूप में दिया जाता है, जबकि रोटेशन को क्वाटरनियन और 3x3 ऑर्थोगोनल मैट्रिक्स दोनों के रूप में प्रदान किया जाता है।

वहाँ S3O4D और की तरह मौजूदा एमएल बेंचमार्क डेटासेट के बीच कई समानताएं हैं NORB , 3 डी कुर्सियों , 3 डी आकृतियाँ और कई अन्य लोगों, जो भी अलग अलग मुद्रा और रोशनी की शर्तों के तहत वस्तुओं का एक सेट का प्रतिपादन शामिल हैं। हालांकि, इन मौजूदा डेटासेट में से कोई भी 3 डी में रोटेशन का पूरा कई गुना में शामिल हैं - सबसे ऊंचाई और दिगंश में परिवर्तन का केवल एक सबसेट शामिल हैं। S3O4D छवियों को समान रूप से और स्वतंत्र रूप से घूर्णन और रोशनी के पूर्ण स्थान से नमूना लिया जाता है, जिसका अर्थ है कि डेटासेट में ऐसी वस्तुएं होती हैं जो पीछे या नीचे से उलटी और प्रकाशित होती हैं। हमारा मानना ​​है कि यह S3O4D को जनरेटिव मॉडल पर शोध के लिए विशिष्ट रूप से अनुकूल बनाता है जहां अव्यक्त स्थान में गैर-तुच्छ टोपोलॉजी है, साथ ही सामान्य मैनिफोल्ड सीखने के तरीकों के लिए जहां मैनिफोल्ड की वक्रता महत्वपूर्ण है।

विभाजित करना उदाहरण
'bunny_test' 20,000
'bunny_train' 80,000
'dragon_test' 20,000
'dragon_train' 80,000
  • विशेषताएं:
FeaturesDict({
    'illumination': Tensor(shape=(3,), dtype=tf.float32),
    'image': Image(shape=(256, 256, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'pose_mat': Tensor(shape=(3, 3), dtype=tf.float32),
    'pose_quat': Tensor(shape=(4,), dtype=tf.float32),
})

VISUALIZATION

  • प्रशस्ति पत्र:
@article{pfau2020disentangling,
  title={Disentangling by Subspace Diffusion},
  author={Pfau, David and Higgins, Irina and Botev, Aleksandar and Racani\`ere,
  S{\'e}bastian},
  journal={Advances in Neural Information Processing Systems (NeurIPS)},
  year={2020}
}