टेंसरफ़्लो :: ऑप्स :: NonMaxSuppressionV5
#include <image_ops.h>
लालच स्कोर के अवरोही क्रम में बाउंडिंग बॉक्स के एक सबसेट का चयन करता है,।
सारांश
पहले से चयनित बक्से के साथ उच्च चौराहे-ओवर-यूनियन (IOU) ओवरलैप वाले बक्से को दूर करना। score_threshold
से कम स्कोर वाले बाउंडिंग बॉक्स हटा दिए score_threshold
हैं। बाउंडिंग बॉक्स को [y1, X1, y2, x2] के रूप में आपूर्ति की जाती है, जहां (y1, X1) और (y2, x2) किसी भी विकर्ण जोड़ी के कोनों के निर्देशांक होते हैं और निर्देशांक सामान्यीकृत (यानी, झूठ बोलकर) प्रदान किए जा सकते हैं अंतराल [0, 1]) या निरपेक्ष। ध्यान दें कि यह एल्गोरिथ्म अज्ञेय है जहां मूल समन्वय प्रणाली में है और आमतौर पर समन्वय प्रणाली के रूढ़िवादी परिवर्तनों और अनुवादों के लिए अपरिवर्तनीय है; इस प्रकार समन्वय प्रणाली के अनुवाद या प्रतिबिंब का परिणाम एल्गोरिथ्म द्वारा चुने गए एक ही बक्से में होता है। इस ऑपरेशन का आउटपुट चयनित बॉक्स का प्रतिनिधित्व करने वाले बाउंडिंग बॉक्स के इनपुट संग्रह में पूर्णांक अनुक्रमण का एक सेट है। बाउंडिंग बॉक्स चयनित सूचकांकों के अनुरूप है, फिर tf.gather operation
का उपयोग करके प्राप्त किया जा सकता है। उदाहरण के लिए: चयनित_इंडिस = tf.image.non_max_suppression_v2 (बॉक्स, स्कोर, अधिकतम_आउटपुट_साइज़, iou_threshold, score_threshold) चयनित_बॉक्स =f.gather (बॉक्स, चयनित_indices) यह ऑप्स एक सॉफ़-एनएमएस (गौसियन वज़निंग के साथ) , https://arxiv.org/abs/1704.04503 ) जहां बक्से उन्हें सीधे के कारण के बजाय अन्य अतिव्यापी बक्से के स्कोर को कम कम कर दिए हैं किया जाना है। इस Soft-NMS मोड को सक्षम करने के लिए, soft_nms_sigma
पैरामीटर को 0 से बड़ा होने के लिए सेट करें।
तर्क:
- गुंजाइश: एक स्कोप ऑब्जेक्ट
- बक्से: आकृति का एक 2-डी फ्लोट टेंसर
[num_boxes, 4]
। - स्कोर: आकृति का एक 1-डी फ्लोट टेंसर
[num_boxes]
प्रत्येक बॉक्स (बॉक्स की प्रत्येक पंक्ति) के अनुरूप एकल स्कोर का प्रतिनिधित्व करता है। - max_output_size: एक स्केलर पूर्णांक टेन्सर, जो अधिकतम अधिकतम दमन द्वारा चुने जाने वाले बॉक्स की अधिकतम संख्या को दर्शाता है।
- iou_threshold: 0-D फ्लोट टेंसर यह तय करने के लिए दहलीज का प्रतिनिधित्व करता है कि बॉक्स IOU के संबंध में बहुत अधिक ओवरलैप हैं या नहीं।
- score_threshold: 0-D फ्लोट टेंसर स्कोर के आधार पर बक्से निकालने के लिए निर्णय लेने के लिए दहलीज का प्रतिनिधित्व करता है।
- soft_nms_sigma: सॉफ्ट एनएमएस के लिए सिग्मा पैरामीटर का प्रतिनिधित्व करने वाला एक 0-डी फ्लोट टेंसर; बोडला एट अल देखें (cf https://arxiv.org/abs/1704.04503 )। जब
soft_nms_sigma=0.0
(जो डिफ़ॉल्ट है), हम मानक (हार्ड) एनएमएस पर वापस आते हैं।
वैकल्पिक विशेषताएँ ( Attrs
देखें):
- pad_to_max_output_size: यदि सही है, तो
selected_indices
max_output_size
। झूठे की अवहेलना।
रिटर्न:
-
Output
चयनित_इंडिस: आकार का एक 1-डी पूर्णांक टेन्सर[M]
बॉक्स टेंसर से चयनित सूचकांकों का प्रतिनिधित्व करता है, जहांM <= max_output_size
। -
Output
M <= max_output_size
प्रत्येक चयनित बॉक्स के लिए इसी स्कोर का प्रतिनिधित्व करते हुए आकृति[M]
का 1-डी फ्लोट टेंसर, जहांM <= max_output_size
। सॉफ्ट एनएमएस (यानी जबsoft_nms_sigma>0
) का उपयोग करते समय स्कोर केवल संबंधित इनपुट स्कोर से भिन्न होते हैं -
Output
valid_outputs: एक 0-D पूर्णांक, जोselected_indices
तत्वों में मान्य तत्वों की संख्या का प्रतिनिधित्व करता है, जिसमें मान्य तत्व पहले दिखाई देते हैं।
कंस्ट्रक्टर और डिस्ट्रक्टर्स | |
---|---|
NonMaxSuppressionV5 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, :: tensorflow::Input soft_nms_sigma) | |
NonMaxSuppressionV5 (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, :: tensorflow::Input soft_nms_sigma, const NonMaxSuppressionV5::Attrs & attrs) |
सार्वजनिक विशेषताएँ | |
---|---|
operation | |
selected_indices | |
selected_scores | |
valid_outputs |
सार्वजनिक स्थैतिक कार्य | |
---|---|
PadToMaxOutputSize (bool x) |
संरचनाएं | |
---|---|
टेंसोफ़्लो :: ऑप्स :: नॉनमैक्सअप्रेशन वी 5 :: एट्र्स | NonMaxSuppressionV5 के लिए वैकल्पिक विशेषता बसती है । |
सार्वजनिक विशेषताएँ
ऑपरेशन
Operation operation
चयनित
::tensorflow::Output selected_indices
चयनित_अंकित
::tensorflow::Output selected_scores
valid_outputs
::tensorflow::Output valid_outputs
सार्वजनिक कार्य
NonMaxSuppressionV5
NonMaxSuppressionV5( const ::tensorflow::Scope & scope, ::tensorflow::Input boxes, ::tensorflow::Input scores, ::tensorflow::Input max_output_size, ::tensorflow::Input iou_threshold, ::tensorflow::Input score_threshold, ::tensorflow::Input soft_nms_sigma )
NonMaxSuppressionV5
NonMaxSuppressionV5( const ::tensorflow::Scope & scope, ::tensorflow::Input boxes, ::tensorflow::Input scores, ::tensorflow::Input max_output_size, ::tensorflow::Input iou_threshold, ::tensorflow::Input score_threshold, ::tensorflow::Input soft_nms_sigma, const NonMaxSuppressionV5::Attrs & attrs )
सार्वजनिक स्थैतिक कार्य
PadToMaxOutputSize
Attrs PadToMaxOutputSize( bool x )