টেনসরফ্লো :: অপস:: ননম্যাক্স দমন V3

#include <image_ops.h>

লোভের সাথে স্কোরের নিচের ক্রম অনুসারে বাউন্ডিং বাক্সের একটি উপসেট নির্বাচন করে।

সারসংক্ষেপ

পূর্বে নির্বাচিত বাক্সগুলির সাথে উচ্চ ইন্টারসেকশন-ওভার-ইউনিয়ন (IOU) ওভারল্যাপযুক্ত বাক্সগুলি ছাঁটাই। score_threshold চেয়ে কম স্কোর সহ বাউন্ডিং বাক্সগুলি সরানো হয়। বাউন্ডিং বাক্সগুলি [y1, x1, y2, x2] হিসাবে সরবরাহ করা হয়, যেখানে (y1, x1) এবং (y2, x2) বাক্সের কোণগুলির যেকোনো তির্যক জোড়ার স্থানাঙ্ক এবং স্থানাঙ্কগুলিকে স্বাভাবিক হিসাবে প্রদান করা যেতে পারে (যেমন, শুয়ে থাকা) ব্যবধান [0, 1]) বা পরম। উল্লেখ্য যে এই অ্যালগরিদমটি অজ্ঞেয়বাদী যেখানে স্থানাঙ্ক ব্যবস্থায় উৎপত্তি এবং আরও সাধারণভাবে স্থানাঙ্ক ব্যবস্থার অর্থোগোনাল রূপান্তর এবং অনুবাদের ক্ষেত্রে অপরিবর্তনীয়; এইভাবে স্থানাঙ্ক সিস্টেমের অনুবাদ বা প্রতিফলনের ফলে অ্যালগরিদম দ্বারা একই বাক্সগুলি নির্বাচন করা হয়। এই ক্রিয়াকলাপের আউটপুট হল পূর্ণসংখ্যার একটি সেট যা নির্বাচিত বাক্সগুলির প্রতিনিধিত্বকারী বাউন্ডিং বাক্সগুলির ইনপুট সংগ্রহে সূচী করে। বাউন্ডিং বক্স স্থানাঙ্ক নির্বাচিত সূচকগুলির সাথে সম্পর্কিত তারপর tf.gather operation ব্যবহার করে প্রাপ্ত করা যেতে পারে। যেমন: নির্বাচিত_সূচক = tf.image.non_max_suppression_v2( বক্স, স্কোর, max_output_size, iou_threshold, score_threshold) Selected_boxes = tf.gather(বক্স, নির্বাচিত_সূচক)

যুক্তি:

  • স্কোপ: একটি স্কোপ অবজেক্ট
  • বাক্স: আকৃতির একটি 2-ডি ফ্লোট টেনসর [num_boxes, 4]
  • স্কোর: আকৃতির একটি 1-ডি ফ্লোট টেনসর [num_boxes] প্রতিটি বাক্সের (প্রতিটি বাক্সের সারি) সাথে সম্পর্কিত একটি একক স্কোর প্রতিনিধিত্ব করে।
  • max_output_size: একটি স্কেলার পূর্ণসংখ্যা টেনসর যা সর্বাধিক সংখ্যক বাক্সের প্রতিনিধিত্ব করে যা অ-ম্যাক্স সাপ্রেশন দ্বারা নির্বাচন করা হবে।
  • iou_threshold: একটি 0-D ফ্লোট টেনসর যা IOU এর ক্ষেত্রে বাক্সগুলি খুব বেশি ওভারল্যাপ করছে কিনা তা সিদ্ধান্ত নেওয়ার জন্য থ্রেশহোল্ডের প্রতিনিধিত্ব করে।
  • স্কোর_থ্রেশহোল্ড: একটি 0-ডি ফ্লোট টেনসর স্কোরের উপর ভিত্তি করে কখন বাক্সগুলি সরাতে হবে তা সিদ্ধান্ত নেওয়ার জন্য থ্রেশহোল্ডের প্রতিনিধিত্ব করে।

রিটার্ন:

  • Output : একটি 1-ডি পূর্ণসংখ্যার টেনসর আকৃতির [M] বক্স টেনসর থেকে নির্বাচিত সূচকগুলিকে প্রতিনিধিত্ব করে, যেখানে M <= max_output_size

কনস্ট্রাক্টর এবং ডেস্ট্রাক্টর

NonMaxSuppressionV3 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold)

পাবলিক বৈশিষ্ট্য

operation
selected_indices

পাবলিক ফাংশন

node () const
::tensorflow::Node *
operator::tensorflow::Input () const
operator::tensorflow::Output () const

পাবলিক বৈশিষ্ট্য

অপারেশন

Operation operation

নির্বাচিত_সূচক

::tensorflow::Output selected_indices

পাবলিক ফাংশন

ননম্যাক্স দমন V3

 NonMaxSuppressionV3(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold
)

নোড

::tensorflow::Node * node() const 

অপারেটর::টেনসরফ্লো::ইনপুট

 operator::tensorflow::Input() const 

অপারেটর::টেনসরফ্লো::আউটপুট

 operator::tensorflow::Output() const