ترجمت واجهة Cloud Translation API‏ هذه الصفحة.
Switch to English

نظرة عامة

شهدت السنوات القليلة الماضية ارتفاعًا في طبقات الرسومات الجديدة القابلة للتمييز والتي يمكن إدراجها في معماريات الشبكة العصبية. من المحولات المكانية إلى عارضات الرسوميات المختلفة ، تعزز هذه الطبقات الجديدة المعرفة المكتسبة عبر سنوات من رؤية الكمبيوتر وأبحاث الرسومات لبناء بنى شبكة جديدة وأكثر كفاءة. إن فتح النماذج والقيود الهندسية بشكل صريح في الشبكات العصبية يفتح الباب أمام البنى التي يمكن تدريبها بقوة وكفاءة ، والأهم من ذلك ، بطريقة تخضع للإشراف الذاتي.

على مستوى عالٍ ، يتطلب خط أنابيب رسومات الكمبيوتر تمثيل كائنات ثلاثية الأبعاد وموضعها المطلق في المشهد ، ووصفًا للمادة المصنوعة منها ، والمصابيح والكاميرا. ثم يفسر العارض وصف المشهد هذا لتوليد عرض اصطناعي.

في المقابل ، سيبدأ نظام رؤية الكمبيوتر من صورة ويحاول استنتاج معلمات المشهد. هذا يسمح بالتنبؤ بالأجسام الموجودة في المشهد ، والمواد المصنوعة منها ، والموقع ثلاثي الأبعاد والتوجه.

غالبًا ما يتطلب تدريب أنظمة التعلم الآلي القادرة على حل مهام الرؤية ثلاثية الأبعاد المعقدة هذه كميات كبيرة من البيانات. نظرًا لأن وضع العلامات على البيانات عملية مكلفة ومعقدة ، فمن المهم أن تكون هناك آليات لتصميم نماذج للتعلم الآلي يمكنها استيعاب العالم ثلاثي الأبعاد أثناء التدريب دون إشراف كبير. يوفر الجمع بين رؤية الكمبيوتر وتقنيات رسومات الكمبيوتر فرصة فريدة للاستفادة من الكميات الهائلة من البيانات غير المصنفة والمتاحة بسهولة. كما هو موضح في الصورة أدناه ، يمكن تحقيق ذلك ، على سبيل المثال ، باستخدام التحليل عن طريق التجميع حيث يقوم نظام الرؤية باستخراج معلمات المشهد ويعيد نظام الرسومات الصورة بناءً عليها. إذا تطابق العرض مع الصورة الأصلية ، فقد استخرج نظام الرؤية بدقة معلمات المشهد. في هذا الإعداد ، تسير رؤية الكمبيوتر ورسومات الكمبيوتر جنبًا إلى جنب ، لتشكيل نظام تعلم آلي واحد مشابه لجهاز الترميز التلقائي ، والذي يمكن تدريبه بطريقة ذاتية الإشراف.

يتم تطوير Tensorflow Graphics للمساعدة في معالجة هذه الأنواع من التحديات وللقيام بذلك ، فإنه يوفر مجموعة من الرسومات المختلفة وطبقات الهندسة (مثل الكاميرات ، ونماذج الانعكاس ، والتحويلات المكانية ، واللفائف الشبكية) ووظائف العارض ثلاثي الأبعاد (مثل 3D TensorBoard) التي يمكن استخدامها لتدريب وتصحيح نماذج التعلم الآلي التي تختارها.