ওভারভিউ

গত কয়েক বছরে নতুন ডিফারেন্সিয়েবল গ্রাফিক্স লেয়ারের বৃদ্ধি ঘটেছে যা নিউরাল নেটওয়ার্ক আর্কিটেকচারে ঢোকানো যেতে পারে। স্থানিক ট্রান্সফরমার থেকে ডিফারেন্সিয়েবল গ্রাফিক্স রেন্ডারার পর্যন্ত, এই নতুন স্তরগুলি নতুন এবং আরও দক্ষ নেটওয়ার্ক আর্কিটেকচার তৈরির জন্য কম্পিউটার দৃষ্টি এবং গ্রাফিক্স গবেষণার বছর ধরে অর্জিত জ্ঞানকে কাজে লাগায়। স্পষ্টভাবে মডেলিং জ্যামিতিক পূর্বের এবং নিউরাল নেটওয়ার্কে সীমাবদ্ধতাগুলি এমন স্থাপত্যের দরজা খুলে দেয় যেগুলি দৃঢ়ভাবে, দক্ষতার সাথে এবং আরও গুরুত্বপূর্ণভাবে, একটি স্ব-তত্ত্বাবধানে ফ্যাশনে প্রশিক্ষিত হতে পারে।

একটি উচ্চ স্তরে, একটি কম্পিউটার গ্রাফিক্স পাইপলাইনের জন্য 3D বস্তুর উপস্থাপনা এবং দৃশ্যে তাদের নিখুঁত অবস্থান, তারা যে উপাদান দিয়ে তৈরি তার বিবরণ, আলো এবং একটি ক্যামেরা প্রয়োজন। এই দৃশ্যের বিবরণটি একটি কৃত্রিম রেন্ডারিং তৈরি করতে একটি রেন্ডারার দ্বারা ব্যাখ্যা করা হয়।

তুলনামূলকভাবে, একটি কম্পিউটার ভিশন সিস্টেম একটি চিত্র থেকে শুরু করবে এবং দৃশ্যের পরামিতিগুলি অনুমান করার চেষ্টা করবে। এটি দৃশ্যে কোন বস্তু রয়েছে, সেগুলি কী উপকরণ দিয়ে তৈরি এবং ত্রিমাত্রিক অবস্থান এবং অভিযোজন সম্পর্কে পূর্বাভাস দেয়।

এই জটিল 3D ভিশন টাস্কগুলি সমাধান করতে সক্ষম প্রশিক্ষণ মেশিন লার্নিং সিস্টেমগুলির জন্য প্রায়শই প্রচুর পরিমাণে ডেটার প্রয়োজন হয়। যেহেতু ডেটা লেবেল করা একটি ব্যয়বহুল এবং জটিল প্রক্রিয়া, তাই মেশিন লার্নিং মডেলগুলি ডিজাইন করার পদ্ধতি থাকা গুরুত্বপূর্ণ যেগুলি খুব বেশি তত্ত্বাবধান ছাড়াই প্রশিক্ষিত হওয়ার সময় ত্রিমাত্রিক বিশ্বকে বুঝতে পারে৷ কম্পিউটার ভিশন এবং কম্পিউটার গ্রাফিক্স কৌশলগুলিকে একত্রিত করা সহজে পাওয়া যায় এমন লেবেলবিহীন ডেটার বিশাল পরিমাণের সুবিধার জন্য একটি অনন্য সুযোগ প্রদান করে। নীচের ছবিতে যেমন চিত্রিত করা হয়েছে, উদাহরণস্বরূপ, এটি সংশ্লেষণের মাধ্যমে বিশ্লেষণ ব্যবহার করে অর্জন করা যেতে পারে যেখানে দৃষ্টি সিস্টেম দৃশ্যের পরামিতিগুলি বের করে এবং গ্রাফিক্স সিস্টেম তাদের উপর ভিত্তি করে একটি চিত্র ফিরিয়ে দেয়। যদি রেন্ডারিং মূল চিত্রের সাথে মেলে, দৃষ্টি সিস্টেমটি দৃশ্যের পরামিতিগুলি নির্ভুলভাবে বের করেছে৷ এই সেটআপে, কম্পিউটার ভিশন এবং কম্পিউটার গ্রাফিক্স একসাথে যায়, একটি অটোএনকোডারের মতো একটি একক মেশিন লার্নিং সিস্টেম গঠন করে, যা একটি স্ব-তত্ত্বাবধানে প্রশিক্ষিত হতে পারে।

এই ধরনের চ্যালেঞ্জ মোকাবেলা করতে সাহায্য করার জন্য টেনসরফ্লো গ্রাফিক্স তৈরি করা হচ্ছে এবং এটি করার জন্য, এটি বিভিন্ন গ্রাফিক্স এবং জ্যামিতি স্তরগুলির একটি সেট প্রদান করে (যেমন ক্যামেরা, প্রতিফলন মডেল, স্থানিক রূপান্তর, মেশ কনভোলিউশন) এবং 3D ভিউয়ার কার্যকারিতা (যেমন 3D টেনসরবোর্ড) আপনার পছন্দের মেশিন লার্নিং মডেলগুলিকে প্রশিক্ষণ এবং ডিবাগ করতে ব্যবহার করা যেতে পারে।