इस पेज का अनुवाद Cloud Translation API से किया गया है.
Switch to English

अवलोकन

पिछले कुछ वर्षों में उपन्यास भिन्न ग्राफिक्स परतों में वृद्धि देखी गई है जो तंत्रिका नेटवर्क आर्किटेक्चर में डाली जा सकती है। स्थानिक ट्रांसफॉर्मर से अलग-अलग ग्राफिक्स रेंडरर्स के लिए, ये नई परतें नए और अधिक कुशल नेटवर्क आर्किटेक्चर के निर्माण के लिए कंप्यूटर विजन और ग्राफिक्स रिसर्च के वर्षों में अर्जित ज्ञान का लाभ उठाती हैं। तंत्रिका नेटवर्क में स्पष्ट रूप से ज्यामितीय पुजारियों और बाधाओं को मॉडलिंग करने से आर्किटेक्चर के द्वार खुल जाते हैं, जिन्हें स्व-निगरानी फैशन में, दृढ़ता से, कुशलतापूर्वक और अधिक महत्वपूर्ण रूप से प्रशिक्षित किया जा सकता है।

एक उच्च स्तर पर, एक कंप्यूटर ग्राफिक्स पाइपलाइन को 3 डी ऑब्जेक्ट्स का प्रतिनिधित्व और दृश्य में उनकी पूर्ण स्थिति की आवश्यकता होती है, उस सामग्री का विवरण जो वे रोशनी और कैमरे से बने होते हैं। यह दृश्य विवरण एक रेंडरर द्वारा सिंथेटिक रेंडरिंग उत्पन्न करने के लिए व्याख्या किया गया है।

इसकी तुलना में, एक कंप्यूटर दृष्टि प्रणाली एक छवि से शुरू होती है और दृश्य के मापदंडों का अनुमान लगाने की कोशिश करती है। यह इस बात की भविष्यवाणी करता है कि दृश्य में कौन सी वस्तुएं हैं, वे किस सामग्री से बने हैं और तीन आयामी स्थिति और अभिविन्यास हैं।

इन जटिल 3 डी दृष्टि कार्यों को हल करने में सक्षम प्रशिक्षण मशीन सीखने की प्रणाली को बड़ी मात्रा में डेटा की आवश्यकता होती है। जैसा कि डेटा लेबल करना एक महंगी और जटिल प्रक्रिया है, मशीन लर्निंग मॉडल को डिजाइन करने के लिए तंत्र होना महत्वपूर्ण है जो कि बिना किसी पर्यवेक्षण के प्रशिक्षित किए हुए तीन आयामी दुनिया को समझ सकता है। कंप्यूटर दृष्टि और कंप्यूटर ग्राफिक्स तकनीकों का संयोजन आसानी से उपलब्ध अनलेब्ड डेटा की विशाल मात्रा का लाभ उठाने का एक अनूठा अवसर प्रदान करता है। उदाहरण के लिए, नीचे दी गई छवि में, यह, संश्लेषण द्वारा विश्लेषण का उपयोग करके प्राप्त किया जा सकता है, जहां दृष्टि प्रणाली दृश्य मापदंडों को निकालती है और ग्राफिक्स सिस्टम उनके आधार पर एक छवि प्रदान करता है। यदि प्रतिपादन मूल छवि से मेल खाता है, तो विज़न सिस्टम ने दृश्य मापदंडों को सही ढंग से निकाला है। इस सेटअप में, कंप्यूटर विज़न और कंप्यूटर ग्राफ़िक्स हाथ से जाते हैं, जो एक ऑटो मशीन के समान एकल मशीन लर्निंग सिस्टम का निर्माण करता है, जिसे स्व-निगरानी तरीके से प्रशिक्षित किया जा सकता है।

इन प्रकार की चुनौतियों से निपटने में मदद करने के लिए टेन्सरफ़्लो ग्राफिक्स विकसित किया जा रहा है और ऐसा करने के लिए, यह विभिन्न प्रकार के ग्राफिक्स और ज्यामिति परतों का एक सेट प्रदान करता है (जैसे कैमरा, परावर्तन मॉडल, स्थानिक रूपांतरण, मेष दृढ़ संकल्प) और 3D व्यूअर फ़ंक्शंसिटीज़ (जैसे 3D TensorBoard) अपनी पसंद के मशीन सीखने के मॉडल को प्रशिक्षित करने और डिबग करने के लिए इस्तेमाल किया जा सकता है।