लालच से स्कोर के अवरोही क्रम में बाउंडिंग बॉक्स के सबसेट का चयन करता है,
उच्च चौराहे-ओवर-यूनियन (IOU) वाले बक्सों को पहले से चयनित बक्सों के साथ ओवरलैप करना। `score_threshold` से कम स्कोर वाले बाउंडिंग बॉक्स हटा दिए जाते हैं। बाउंडिंग बॉक्स की आपूर्ति [y1, x1, y2, x2] के रूप में की जाती है, जहां (y1, x1) और (y2, x2) बॉक्स कोनों के किसी भी विकर्ण जोड़ी के निर्देशांक हैं और निर्देशांक सामान्यीकृत के रूप में प्रदान किए जा सकते हैं। अंतराल [0, 1]) या निरपेक्ष। ध्यान दें कि यह एल्गोरिथम अज्ञेय है जहां मूल समन्वय प्रणाली में है और आमतौर पर समन्वय प्रणाली के ऑर्थोगोनल परिवर्तनों और अनुवादों के लिए अपरिवर्तनीय है; इस प्रकार समन्वय प्रणाली के अनुवाद या प्रतिबिंब के परिणामस्वरूप एल्गोरिदम द्वारा समान बक्से का चयन किया जाता है। इस ऑपरेशन का आउटपुट चयनित बॉक्स का प्रतिनिधित्व करने वाले बाउंडिंग बॉक्स के इनपुट संग्रह में पूर्णांकों का एक सेट है। तब चयनित सूचकांकों के अनुरूप बाउंडिंग बॉक्स निर्देशांक `tf.gather ऑपरेशन` का उपयोग करके प्राप्त किया जा सकता है। उदाहरण के लिए: Selected_indices = tf.image.non_max_suppression_v2(box, Score, max_output_size, iou_threshold, Score_threshold) Selected_boxes = tf.gather(boxes, Selected_indices) यह ऑप एक सॉफ्ट-एनएमएस (गॉसियन वेटिंग के साथ) मोड (alf Bodla et) को भी सपोर्ट करता है। , https://arxiv.org/abs/1704.04503) जहां बॉक्स दूसरे ओवरलैपिंग बॉक्स के स्कोर को कम कर देते हैं बजाय इसके कि उन्हें सीधे काट दिया जाए। इस सॉफ्ट-एनएमएस मोड को सक्षम करने के लिए, `soft_nms_sigma` पैरामीटर को 0 से बड़ा करने के लिए सेट करें।
नेस्टेड कक्षाएं
कक्षा | NonMaxSuppressionV5.Options | NonMaxSuppressionV5 के लिए वैकल्पिक विशेषताएँ |
सार्वजनिक तरीके
स्थिर <T संख्या बढ़ाता है> NonMaxSuppressionV5 <T> | |
स्थिर NonMaxSuppressionV5.Options | padToMaxOutputSize (बूलियन पैडToMaxOutputSize) |
आउटपुट <पूर्णांक> | चयनित सूचकांक () आकार का एक 1-डी पूर्णांक टेंसर `[एम]` बॉक्स टेंसर से चयनित सूचकांकों का प्रतिनिधित्व करता है, जहां `एम <= max_output_size`। |
आउटपुट <टी> | चयनित स्कोर () आकार का एक 1-डी फ्लोट टेंसर `[एम]` प्रत्येक चयनित बॉक्स के लिए संबंधित स्कोर का प्रतिनिधित्व करता है, जहां `एम <= max_output_size`। |
आउटपुट <पूर्णांक> | वैध आउटपुट () एक 0-डी पूर्णांक टेंसर `चयनित_इंडिस` में मान्य तत्वों की संख्या का प्रतिनिधित्व करता है, जिसमें मान्य तत्व पहले दिखाई देते हैं। |
विरासत में मिली विधियां
सार्वजनिक तरीके
पब्लिक स्टैटिक नॉनमैक्ससुप्रेशनV5 <T> क्रिएट ( स्कोप स्कोप, ऑपरेंड <T> बॉक्स, ऑपरेंड <T> स्कोर, ऑपरेंड <इंटीजर> मैक्सऑटपुट साइज, ऑपरेंड <T> iouThreshold, ऑपरेंड <T> स्कोर थ्रेशोल्ड, ऑपरेंड <T> softNmsSigma, Options.. विकल्प )
एक नया NonMaxSuppressionV5 ऑपरेशन रैपिंग क्लास बनाने के लिए फ़ैक्टरी विधि।
मापदंडों
दायरा | वर्तमान दायरा |
---|---|
बक्से | आकार का एक 2-डी फ्लोट टेंसर [num_boxes, 4]`। |
स्कोर | आकार का एक 1-डी फ्लोट टेंसर [num_boxes]` प्रत्येक बॉक्स (बॉक्स की प्रत्येक पंक्ति) के अनुरूप एकल स्कोर का प्रतिनिधित्व करता है। |
अधिकतम आउटपुट आकार: | एक अदिश पूर्णांक टेंसर गैर अधिकतम दमन द्वारा चुने जाने वाले बक्सों की अधिकतम संख्या का प्रतिनिधित्व करता है। |
मैं दहलीज | 0-डी फ्लोट टेंसर यह तय करने के लिए थ्रेशोल्ड का प्रतिनिधित्व करता है कि क्या बॉक्स IOU के संबंध में बहुत अधिक ओवरलैप करते हैं। |
स्कोर दहलीज | स्कोर के आधार पर बॉक्स को कब निकालना है, यह तय करने के लिए थ्रेशोल्ड का प्रतिनिधित्व करने वाला 0-डी फ्लोट टेंसर। |
सॉफ्टएनएमएससिग्मा | सॉफ्ट एनएमएस के लिए सिग्मा पैरामीटर का प्रतिनिधित्व करने वाला 0-डी फ्लोट टेंसर; बोडला एट अल देखें (सीएफ https://arxiv.org/abs/1704.04503)। जब `soft_nms_sigma=0.0` (जो कि डिफ़ॉल्ट है), हम मानक (हार्ड) NMS पर वापस आ जाते हैं। |
विकल्प | वैकल्पिक विशेषता मान रखता है |
रिटर्न
- NonMaxSuppressionV5 का एक नया उदाहरण
सार्वजनिक स्थैतिक NonMaxSuppressionV5.Options padToMaxOutputSize (बूलियन पैडToMaxOutputSize)
मापदंडों
पैडटॉमैक्सआउटपुटसाइज | अगर सही है, तो आउटपुट `चयनित_इंडिस` को लंबाई `max_output_size` के लिए गद्देदार किया जाता है। असत्य के लिए डिफ़ॉल्ट। |
---|
सार्वजनिक आउटपुट <पूर्णांक> चयनित इंडेक्स ()
आकार का एक 1-डी पूर्णांक टेंसर `[एम]` बॉक्स टेंसर से चयनित सूचकांकों का प्रतिनिधित्व करता है, जहां `एम <= max_output_size`।
सार्वजनिक आउटपुट <T> चयनित स्कोर ()
आकार का एक 1-डी फ्लोट टेंसर `[एम]` प्रत्येक चयनित बॉक्स के लिए संबंधित स्कोर का प्रतिनिधित्व करता है, जहां `एम <= max_output_size`। सॉफ्ट एनएमएस का उपयोग करते समय स्कोर केवल संबंधित इनपुट स्कोर से भिन्न होते हैं (अर्थात जब `soft_nms_sigma>0`)
सार्वजनिक आउटपुट <पूर्णांक> मान्य आउटपुट ()
एक 0-डी पूर्णांक टेंसर `चयनित_इंडिस` में मान्य तत्वों की संख्या का प्रतिनिधित्व करता है, जिसमें मान्य तत्व पहले दिखाई देते हैं।