این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.
Switch to English

بررسی اجمالی

در چند سال گذشته شاهد افزایش لایه های گرافیکی متمایز رمان هستیم که می توان در معماری های شبکه عصبی درج کرد. از ترانسفورماتورهای مکانی گرفته تا رندرهای گرافیکی متمایز ، این لایه های جدید دانش به دست آمده در طی سالها از دید رایانه و تحقیقات گرافیکی را برای ایجاد معماریهای جدید و کارآمد شبکه به کار می گیرند. به طور صریح مدل سازی مکانهای هندسی و محدودیت ها در شبکه های عصبی ، درهای معماری را باز می کند که می توان با شیوه ای با نظارت خود به صورت نیرومند ، کارآمد و مهمتر از آن آموزش داد.

در سطح بالایی ، یک خط لوله گرافیکی رایانه ای نیاز به بازنمایی اشیاء سه بعدی و موقعیت مطلق آنها در صحنه ، شرح مطالبی که از آنها ساخته شده است ، چراغ ها و دوربین است. این توضیحات صحنه سپس توسط یک رندر تفسیر می شود تا یک رندر مصنوعی تولید کند.

در مقایسه ، یک سیستم بینایی کامپیوتر از یک تصویر شروع می شود و سعی می کند پارامترهای صحنه را استنباط کند. این اجازه می دهد تا پیش بینی اینکه اشیاء در صحنه هستند ، از چه موادی ساخته شده اند و موقعیت و جهت گیری سه بعدی دارند.

سیستمهای یادگیری ماشین قادر به حل این کارهای پیچیده بینایی 3D هستند که اغلب به مقادیر زیادی داده نیاز دارند. از آنجا که برچسب زدن داده ها یک فرآیند پرهزینه و پیچیده است ، داشتن مکانیزم هایی برای طراحی مدل های یادگیری ماشین است که می تواند دنیای سه بعدی را در حالی که بدون نظارت زیاد آموزش می یابد درک کند. ترکیب تکنیک های بینایی و گرافیک رایانه ، فرصتی بی نظیر برای بهره گیری از مقادیر زیادی از داده های بدون مارک در دسترس است. همانطور که در تصویر زیر نشان داده شده است ، برای مثال می توان با استفاده از تجزیه و تحلیل با سنتز در جایی که سیستم بینایی پارامترهای صحنه را استخراج می کند و سیستم گرافیکی تصویری را بر اساس آنها بازگرداند ، بدست آورد. اگر رندر با تصویر اصلی مطابقت داشته باشد ، سیستم دید با دقت پارامترهای صحنه را استخراج می کند. در این تنظیم ، دید رایانه و گرافیک رایانه به هم می رسند و یک سیستم یادگیری واحد واحد شبیه به یک خودکار خودکار را تشکیل می دهند که می تواند به صورت خود نظارت انجام شود.

Tensorflow Graphics برای کمک به مقابله با این نوع چالش ها و انجام این کار ، مجموعه ای از لایه های گرافیکی و هندسه متمایز (به عنوان مثال دوربین ها ، مدل های بازتاب ، تحولات مکانی ، پیچش مش) و قابلیت های بیننده سه بعدی (مانند 3D TensorBoard) را فراهم می کند. می تواند مورد استفاده قرار گیرد برای آموزش و اشکال زدایی مدل های یادگیری ماشین مورد نظر خود را انتخاب کنید.