CombinedNonMaxSuppression

সর্বজনীন চূড়ান্ত ক্লাস সম্মিলিত ননম্যাক্স দমন

লোভের সাথে স্কোরের নিচের ক্রম অনুসারে বাউন্ডিং বাক্সের একটি উপসেট নির্বাচন করে,

এই ক্রিয়াকলাপটি সমস্ত শ্রেণীতে প্রতি ব্যাচের ইনপুটগুলিতে non_max_suppression সঞ্চালন করে। উচ্চ ইন্টারসেকশন-ওভার-ইউনিয়ন (IOU) পূর্বে নির্বাচিত বাক্সগুলির সাথে ওভারল্যাপযুক্ত বাক্সগুলিকে ছাঁটাই করে। বাউন্ডিং বাক্সগুলি [y1, x1, y2, x2] হিসাবে সরবরাহ করা হয়, যেখানে (y1, x1) এবং (y2, x2) বাক্সের কোণগুলির যেকোনো তির্যক জোড়ার স্থানাঙ্ক এবং স্থানাঙ্কগুলিকে স্বাভাবিক হিসাবে প্রদান করা যেতে পারে (যেমন, শুয়ে থাকা) ব্যবধান [0, 1]) বা পরম। লক্ষ্য করুন যে এই অ্যালগরিদমটি অজ্ঞেয়বাদী যেখানে স্থানাঙ্ক ব্যবস্থায় উৎপত্তি। এছাড়াও মনে রাখবেন যে এই অ্যালগরিদমটি অরথোগোনাল রূপান্তর এবং স্থানাঙ্ক সিস্টেমের অনুবাদের জন্য অপরিবর্তনীয়; এইভাবে স্থানাঙ্ক সিস্টেমের অনুবাদ বা প্রতিফলনের ফলে অ্যালগরিদম দ্বারা একই বাক্সগুলি নির্বাচন করা হয়। এই ক্রিয়াকলাপের আউটপুট হল চূড়ান্ত বাক্স, স্কোর এবং ক্লাস টেনসর যা non_max_suppression করার পরে ফেরত আসে।

নেস্টেড ক্লাস

ক্লাস সম্মিলিতNonMaxSuppression.Options CombinedNonMaxSuppression এর জন্য ঐচ্ছিক বৈশিষ্ট্য

পাবলিক পদ্ধতি

স্ট্যাটিক CombinedNonMaxSuppression.Options
ক্লিপবক্স (বুলিয়ান ক্লিপবক্স)
স্ট্যাটিক সম্মিলিত ননম্যাক্স দমন
তৈরি করুন ( স্কোপ স্কোপ, অপারেন্ড <ফ্লোট> বক্স, অপারেন্ড <ফ্লোট> স্কোর, অপারেন্ড <পূর্ণসংখ্যা> maxOutputSizePerClass, Operand <Integer> maxTotalSize, Operand <Float> iouThreshold, Operand <Float> স্কোর থ্রেশহোল্ড, বিকল্পগুলি ... )
একটি নতুন CombinedNonMaxSuppression অপারেশন মোড়ানো একটি ক্লাস তৈরি করার কারখানা পদ্ধতি।
আউটপুট <ফ্লোট>
nmsedBoxes ()
একটি [batch_size, max_detections, 4] float32 টেনসর যাতে নন-সপ্রেসড বক্স থাকে।
আউটপুট <ফ্লোট>
nmsed ক্লাস ()
একটি [ব্যাচ_সাইজ, সর্বোচ্চ_সনাক্তকরণ] ফ্লোট 32 টেনসর যাতে বক্সগুলির ক্লাস রয়েছে।
আউটপুট <ফ্লোট>
nmsedস্কোর ()
একটি [batch_size, max_detections] float32 টেনসর যাতে বক্সগুলির স্কোর থাকে।
স্ট্যাটিক CombinedNonMaxSuppression.Options
padPerClass (বুলিয়ান প্যাডপারক্লাস)
আউটপুট <পূর্ণসংখ্যা>
বৈধ সনাক্তকরণ ()
একটি [ব্যাচ_সাইজ] int32 টেনসর প্রতি ব্যাচ আইটেমের বৈধ সনাক্তকরণের সংখ্যা নির্দেশ করে।

উত্তরাধিকারসূত্রে প্রাপ্ত পদ্ধতি

পাবলিক পদ্ধতি

সর্বজনীন স্ট্যাটিক সম্মিলিত ননম্যাক্স দমন । বিকল্প ক্লিপবক্স (বুলিয়ান ক্লিপবক্স)

পরামিতি
ক্লিপবক্স সত্য হলে, অনুমান করুন বক্স স্থানাঙ্কগুলি [0, 1] এর মধ্যে রয়েছে এবং আউটপুট বাক্সগুলি ক্লিপ করুন যদি তারা [0, 1] এর বাইরে পড়ে যায়। মিথ্যা হলে, ক্লিপিং করবেন না এবং বক্সের স্থানাঙ্ক যেমন আছে তেমন আউটপুট করবেন না।

সর্বজনীন স্ট্যাটিক সম্মিলিত ননম্যাক্স দমন তৈরি করুন ( স্কোপ স্কোপ, অপারেন্ড <ফ্লোট> বক্স, অপারেন্ড <ফ্লোট> স্কোর, অপারেন্ড <পূর্ণসংখ্যা > maxOutputSizePerClass, অপারেন্ড <Integer> maxTotalSize, Operand <ফ্লোট> iouThreshold> বিকল্প, <Threshold> অপশন , অপারেন্ড লোড...

একটি নতুন CombinedNonMaxSuppression অপারেশন মোড়ানো একটি ক্লাস তৈরি করার কারখানা পদ্ধতি।

পরামিতি
সুযোগ বর্তমান সুযোগ
বাক্স আকৃতির একটি 4-D ফ্লোট টেনসর `[ব্যাচ_সাইজ, সংখ্যা_বক্স, q, 4]`। যদি `q` 1 হয় তাহলে একই বক্স সব শ্রেণীর জন্য ব্যবহার করা হয় অন্যথায়, যদি `q` ক্লাসের সংখ্যার সমান হয়, শ্রেণী-নির্দিষ্ট বাক্স ব্যবহার করা হয়।
স্কোর একটি 3-D ফ্লোট টেনসর আকৃতি `[batch_size, num_boxes, num_classes]` প্রতিটি বাক্সের (বাক্সের প্রতিটি সারি) সাথে সম্পর্কিত একটি একক স্কোর প্রতিনিধিত্ব করে।
maxOutputSizePerClass একটি স্কেলার পূর্ণসংখ্যা টেনসর যা প্রতি শ্রেণীতে অ-ম্যাক্স সাপ্রেশন দ্বারা নির্বাচিত সর্বাধিক সংখ্যক বাক্সের প্রতিনিধিত্ব করে
সর্বোচ্চ মোট আকার একটি int32 স্কেলার যা সব শ্রেণীর সর্বোচ্চ সংখ্যক বাক্সের প্রতিনিধিত্ব করে। মনে রাখবেন যে এই মানটিকে একটি বড় সংখ্যায় সেট করার ফলে সিস্টেমের কাজের চাপের উপর নির্ভর করে OOM ত্রুটি হতে পারে।
iouThreshold একটি 0-D ফ্লোট টেনসর যা IOU এর ক্ষেত্রে বাক্সগুলি খুব বেশি ওভারল্যাপ করছে কিনা তা সিদ্ধান্ত নেওয়ার জন্য থ্রেশহোল্ডের প্রতিনিধিত্ব করে৷
স্কোর থ্রেশহোল্ড একটি 0-D ফ্লোট টেনসর যা স্কোরের উপর ভিত্তি করে কখন বাক্সগুলি সরাতে হবে তা সিদ্ধান্ত নেওয়ার জন্য থ্রেশহোল্ডের প্রতিনিধিত্ব করে৷
বিকল্প ঐচ্ছিক বৈশিষ্ট্য মান বহন করে
রিটার্নস
  • CombinedNonMaxSuppression এর একটি নতুন উদাহরণ

সর্বজনীন আউটপুট <ফ্লোট> nmsedBoxes ()

একটি [batch_size, max_detections, 4] float32 টেনসর যাতে নন-সপ্রেসড বক্স থাকে।

সর্বজনীন আউটপুট <ফ্লোট> nmsedClasses ()

একটি [ব্যাচ_সাইজ, সর্বোচ্চ_সনাক্তকরণ] ফ্লোট 32 টেনসর যাতে বক্সগুলির ক্লাস রয়েছে।

সর্বজনীন আউটপুট <ফ্লোট> nmsedScores ()

একটি [batch_size, max_detections] float32 টেনসর যাতে বক্সগুলির স্কোর থাকে।

পাবলিক স্ট্যাটিক CombinedNonMaxSuppression.Options padPerClass (বুলিয়ান প্যাডপারক্লাস)

পরামিতি
padPerClass মিথ্যা হলে, আউটপুট nmsed বক্স, স্কোর এবং ক্লাস প্যাড/ক্লিপ করা হয় `max_total_size`-এ। যদি সত্য হয়, আউটপুট nmsed বক্স, স্কোর এবং ক্লাস দৈর্ঘ্য `max_size_per_class`*`num_classes` এর জন্য প্যাড করা হয়, যদি না এটি `max_total_size` অতিক্রম করে যে ক্ষেত্রে এটি `max_total_size` এ ক্লিপ করা হয়। ডিফল্ট থেকে মিথ্যা.

সর্বজনীন আউটপুট <Integer> validDetections ()

একটি [ব্যাচ_সাইজ] int32 টেনসর প্রতি ব্যাচ আইটেমের বৈধ সনাক্তকরণের সংখ্যা নির্দেশ করে। nms_boxes[i], nms_scores[i] এবং nms_class[i]-এ শুধুমাত্র উপরের num_detections[i] এন্ট্রি বৈধ। বাকি এন্ট্রি শূন্য প্যাডিং হয়.