tensorflow :: অপস:: ননম্যাক্স দমন ভি৪

#include <image_ops.h>

লোভের সাথে স্কোরের নিচের ক্রম অনুসারে বাউন্ডিং বাক্সের একটি উপসেট নির্বাচন করে।

সারসংক্ষেপ

পূর্বে নির্বাচিত বাক্সগুলির সাথে উচ্চ ইন্টারসেকশন-ওভার-ইউনিয়ন (IOU) ওভারল্যাপযুক্ত বাক্সগুলি ছাঁটাই। score_threshold চেয়ে কম স্কোর সহ বাউন্ডিং বাক্সগুলি সরানো হয়। বাউন্ডিং বাক্সগুলি [y1, x1, y2, x2] হিসাবে সরবরাহ করা হয়, যেখানে (y1, x1) এবং (y2, x2) বাক্সের কোণগুলির যেকোনো তির্যক জোড়ার স্থানাঙ্ক এবং স্থানাঙ্কগুলিকে স্বাভাবিক হিসাবে প্রদান করা যেতে পারে (যেমন, শুয়ে থাকা) ব্যবধান [0, 1]) বা পরম। উল্লেখ্য যে এই অ্যালগরিদমটি অজ্ঞেয়বাদী যেখানে স্থানাঙ্ক ব্যবস্থায় উৎপত্তি এবং আরও সাধারণভাবে স্থানাঙ্ক ব্যবস্থার অর্থোগোনাল রূপান্তর এবং অনুবাদের ক্ষেত্রে অপরিবর্তনীয়; এইভাবে স্থানাঙ্ক সিস্টেমের অনুবাদ বা প্রতিফলনের ফলে অ্যালগরিদম দ্বারা একই বাক্সগুলি নির্বাচন করা হয়। এই ক্রিয়াকলাপের আউটপুট হল পূর্ণসংখ্যার একটি সেট যা নির্বাচিত বাক্সগুলির প্রতিনিধিত্বকারী বাউন্ডিং বাক্সগুলির ইনপুট সংগ্রহে সূচী করে। বাউন্ডিং বক্স স্থানাঙ্ক নির্বাচিত সূচকগুলির সাথে সম্পর্কিত তারপর tf.gather operation ব্যবহার করে প্রাপ্ত করা যেতে পারে। যেমন: নির্বাচিত_সূচক = tf.image.non_max_suppression_v2( বক্স, স্কোর, max_output_size, iou_threshold, score_threshold) Selected_boxes = tf.gather(বক্স, নির্বাচিত_সূচক)

যুক্তি:

  • স্কোপ: একটি স্কোপ অবজেক্ট
  • বাক্স: আকৃতির একটি 2-ডি ফ্লোট টেনসর [num_boxes, 4]
  • স্কোর: আকৃতির একটি 1-ডি ফ্লোট টেনসর [num_boxes] প্রতিটি বাক্সের (প্রতিটি বাক্সের সারি) সাথে সম্পর্কিত একটি একক স্কোর প্রতিনিধিত্ব করে।
  • max_output_size: একটি স্কেলার পূর্ণসংখ্যা টেনসর যা সর্বাধিক সংখ্যক বাক্সের প্রতিনিধিত্ব করে যা অ-ম্যাক্স সাপ্রেশন দ্বারা নির্বাচন করা হবে।
  • iou_threshold: একটি 0-D ফ্লোট টেনসর যা IOU এর ক্ষেত্রে বাক্সগুলি খুব বেশি ওভারল্যাপ করছে কিনা তা সিদ্ধান্ত নেওয়ার জন্য থ্রেশহোল্ডের প্রতিনিধিত্ব করে।
  • স্কোর_থ্রেশহোল্ড: একটি 0-ডি ফ্লোট টেনসর স্কোরের উপর ভিত্তি করে কখন বাক্সগুলি সরাতে হবে তা সিদ্ধান্ত নেওয়ার জন্য থ্রেশহোল্ডের প্রতিনিধিত্ব করে।

ঐচ্ছিক বৈশিষ্ট্য (দেখুন Attrs ):

  • pad_to_max_output_size: সত্য হলে, আউটপুট selected_indices প্যাড করা হয় যাতে দৈর্ঘ্য max_output_size হয়। ডিফল্ট থেকে মিথ্যা.

রিটার্ন:

  • Output নির্বাচিত_সূচক: আকৃতির একটি 1-ডি পূর্ণসংখ্যা টেনসর [M] যা বক্স টেনসর থেকে নির্বাচিত সূচকগুলিকে প্রতিনিধিত্ব করে, যেখানে M <= max_output_size
  • Output বৈধ_আউটপুট: একটি 0-ডি পূর্ণসংখ্যা টেনসর যা selected_indices বৈধ উপাদানের সংখ্যা উপস্থাপন করে, বৈধ উপাদানগুলি প্রথমে উপস্থিত হয়।

কনস্ট্রাক্টর এবং ডেস্ট্রাক্টর

NonMaxSuppressionV4 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold)
NonMaxSuppressionV4 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, const NonMaxSuppressionV4::Attrs & attrs)

পাবলিক বৈশিষ্ট্য

operation
selected_indices
valid_outputs

পাবলিক স্ট্যাটিক ফাংশন

PadToMaxOutputSize (bool x)

কাঠামো

tensorflow:: ops:: NonMaxSuppressionV4:: Attrs

NonMaxSuppressionV4 এর জন্য ঐচ্ছিক অ্যাট্রিবিউট সেটার।

পাবলিক বৈশিষ্ট্য

অপারেশন

Operation operation

নির্বাচিত_সূচক

::tensorflow::Output selected_indices

বৈধ_আউটপুট

::tensorflow::Output valid_outputs

পাবলিক ফাংশন

ননম্যাক্স দমন ভি৪

 NonMaxSuppressionV4(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold
)

ননম্যাক্স দমন ভি৪

 NonMaxSuppressionV4(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold,
  const NonMaxSuppressionV4::Attrs & attrs
)

পাবলিক স্ট্যাটিক ফাংশন

PadToMaxOutputSize

Attrs PadToMaxOutputSize(
  bool x
)