NonMaxSuppressionV5

الفئة النهائية العامة NonMaxSuppressionV5

يختار بجشع مجموعة فرعية من المربعات المحيطة بترتيب تنازلي للنتيجة،

تشذيب المربعات التي تحتوي على تقاطع عالي فوق الاتحاد (IOU) يتداخل مع المربعات المحددة مسبقًا. تتم إزالة المربعات المحيطة ذات النقاط الأقل من `score_threshold`. يتم توفير المربعات المحيطة بالشكل [y1، x1، y2، x2]، حيث (y1، x1) و (y2، x2) هي إحداثيات أي زوج قطري من زوايا الصندوق ويمكن تقديم الإحداثيات بشكل طبيعي (على سبيل المثال، الكذب في الفاصل الزمني [0، 1]) أو المطلق. لاحظ أن هذه الخوارزمية لا تعرف مكان الأصل في نظام الإحداثيات وهي بشكل عام ثابتة بالنسبة للتحويلات المتعامدة وترجمات نظام الإحداثيات؛ وبالتالي فإن ترجمة أو انعكاسات نظام الإحداثيات تؤدي إلى تحديد نفس المربعات بواسطة الخوارزمية. مخرجات هذه العملية عبارة عن مجموعة من الأعداد الصحيحة المفهرسة في مجموعة الإدخال للمربعات المحيطة التي تمثل المربعات المحددة. ويمكن بعد ذلك الحصول على إحداثيات المربع المحيط المطابقة للمؤشرات المحددة باستخدام عملية tf.gather. على سبيل المثال: Selected_indices = tf.image.non_max_suppression_v2(boxes, Scores, max_output_size, iou_threshold, Score_threshold) Selected_boxes = tf.gather(boxes, Selected_indices) تدعم هذه العملية أيضًا وضع Soft-NMS (مع ترجيح غاوسي) (راجع Bodla et al ، https://arxiv.org/abs/1704.04503) حيث تقلل المربعات درجة المربعات المتداخلة الأخرى بدلاً من التسبب في تقليمها بشكل مباشر. لتمكين وضع Soft-NMS هذا، قم بتعيين المعلمة `soft_nms_sigma` لتكون أكبر من 0.

فئات متداخلة

فصل NonMaxSuppressionV5.Options السمات الاختيارية لـ NonMaxSuppressionV5

الأساليب العامة

ثابت <T يمتد الرقم> NonMaxSuppressionV5 <T>
إنشاء (نطاق النطاق ، مربعات المعامل <T>، درجات المعامل <T>، المعامل <Integer> maxOutputSize، المعامل <T> iouThreshold، المعامل <T> ScoreThreshold، المعامل <T> softNmsSigma ، خيارات ... )
طريقة المصنع لإنشاء فئة تلتف حول عملية NonMaxSuppressionV5 جديدة.
ثابت NonMaxSuppressionV5.Options
PadToMaxOutputSize (منطقي PadToMaxOutputSize)
الإخراج <عدد صحيح>
المؤشرات المحددة ()
موتر عدد صحيح أحادي الأبعاد على شكل `[M]` يمثل المؤشرات المحددة من موتر المربعات، حيث `M <= max_output_size`.
الإخراج <T>
النتائج المختارة ()
موتر عائم أحادي الأبعاد على شكل `[M]` يمثل الدرجات المقابلة لكل مربع محدد، حيث `M <= max_output_size`.
الإخراج <عدد صحيح>
مخرجات صالحة ()
موتر عدد صحيح 0-D يمثل عدد العناصر الصالحة في "المؤشرات_المحددة"، مع ظهور العناصر الصالحة أولاً.

الطرق الموروثة

الأساليب العامة

إنشاء NonMaxSuppressionV5 <T> ثابت عام ( نطاق النطاق، مربعات المعامل <T>، نقاط المعامل <T>، المعامل <Integer> maxOutputSize، المعامل <T> iouThreshold، المعامل <T> ScoreThreshold، المعامل <T> softNmsSigma، الخيارات.. . خيارات)

طريقة المصنع لإنشاء فئة تلتف حول عملية NonMaxSuppressionV5 جديدة.

حدود
نِطَاق النطاق الحالي
مربعات موتر عائم ثنائي الأبعاد ذو شكل `[num_boxes, 4]`.
درجات موتر عائم أحادي الأبعاد ذو شكل `[num_boxes]` يمثل درجة واحدة تتوافق مع كل مربع (كل صف من المربعات).
maxOutputSize موتر عددي صحيح يمثل الحد الأقصى لعدد المربعات التي سيتم تحديدها عن طريق القمع غير الأقصى.
ioThreshold موتر عائم ذو 0-D يمثل العتبة لتحديد ما إذا كانت الصناديق تتداخل أكثر من اللازم فيما يتعلق بوحدة IOU.
ScoreThreshold موتر عائم ذو 0-D يمثل الحد الأدنى لتحديد وقت إزالة المربعات بناءً على النتيجة.
softNmsSigma موتر عائم 0-D يمثل معلمة سيجما لـ Soft NMS؛ انظر بودلا وآخرون (راجع https://arxiv.org/abs/1704.04503). عندما يكون `soft_nms_sigma=0.0` (وهو الإعداد الافتراضي)، فإننا نعود إلى NMS القياسي (الصلب).
خيارات يحمل قيم السمات الاختيارية
عائدات
  • مثيل جديد لـ NonMaxSuppressionV5

NonMaxSuppressionV5.Options ثابت عام ، PadToMaxOutputSize (منطقي، PadToMaxOutputSize)

حدود
PadToMaxOutputSize إذا كان صحيحًا، فسيتم تعبئة الإخراج "selected_indices" ليكون بطول "max_output_size". الافتراضيات كاذبة.

الإخراج العام <عدد صحيح> الفهارس المحددة ()

موتر عدد صحيح أحادي الأبعاد على شكل `[M]` يمثل المؤشرات المحددة من موتر المربعات، حيث `M <= max_output_size`.

الإخراج العام <T> الدرجات المحددة ()

موتر عائم أحادي الأبعاد على شكل `[M]` يمثل الدرجات المقابلة لكل مربع محدد، حيث `M <= max_output_size`. تختلف النتائج فقط عن درجات الإدخال المقابلة عند استخدام Soft NMS (أي عند `soft_nms_sigma>0`)

الإخراج العام <عدد صحيح> المخرجات الصالحة ()

موتر عدد صحيح 0-D يمثل عدد العناصر الصالحة في "المؤشرات_المحددة"، مع ظهور العناصر الصالحة أولاً.