लालच से स्कोर के घटते क्रम में बाउंडिंग बॉक्स का एक सबसेट चुनता है,
यह ऑपरेशन सभी वर्गों में प्रति बैच इनपुट पर नॉन_मैक्स_सप्रेशन करता है। पहले से चयनित बक्सों के साथ उच्च इंटरसेक्शन-ओवर-यूनियन (आईओयू) ओवरलैप वाले बक्सों को काट-छांट कर हटा दें। बाउंडिंग बॉक्स को [y1, x1, y2, x2] के रूप में आपूर्ति की जाती है, जहां (y1, x1) और (y2, x2) बॉक्स कोनों की किसी भी विकर्ण जोड़ी के निर्देशांक हैं और निर्देशांक को सामान्यीकृत (यानी, झूठ बोलते हुए) के रूप में प्रदान किया जा सकता है अंतराल [0, 1]) या पूर्ण। ध्यान दें कि यह एल्गोरिदम इस बात से अज्ञेयवादी है कि समन्वय प्रणाली में मूल कहां है। यह भी ध्यान दें कि यह एल्गोरिदम समन्वय प्रणाली के ऑर्थोगोनल परिवर्तनों और अनुवादों के लिए अपरिवर्तनीय है; इस प्रकार समन्वय प्रणाली के अनुवाद या प्रतिबिंब के परिणामस्वरूप एल्गोरिदम द्वारा समान बक्से का चयन किया जाता है। इस ऑपरेशन का आउटपुट अंतिम बॉक्स, स्कोर और क्लास टेंसर है जो नॉन_मैक्स_सप्रेशन करने के बाद लौटाया जाता है।
नेस्टेड क्लासेस
कक्षा | संयुक्तनॉनमैक्ससप्रेशन.विकल्प | CombinedNonMaxSuppression के लिए वैकल्पिक विशेषताएँ |
सार्वजनिक तरीके
स्टेटिक कंबाइंडनॉनमैक्ससप्रेशन.ऑप्शंस | क्लिपबॉक्स (बूलियन क्लिपबॉक्स) |
स्टेटिक कंबाइंडनॉनमैक्ससप्रेशन | |
आउटपुट <फ्लोट> | nmsedBoxes () एक [बैच_आकार, अधिकतम_डिटेक्शन, 4] फ्लोट32 टेंसर जिसमें गैर-अधिकतम दबाए गए बक्से होते हैं। |
आउटपुट <फ्लोट> | nmsedClasses () एक [बैच_आकार, अधिकतम_डिटेक्शन] फ्लोट32 टेंसर जिसमें बक्सों के लिए कक्षाएं शामिल हैं। |
आउटपुट <फ्लोट> | nmsedScores () एक [बैच_आकार, अधिकतम_डिटेक्शन] फ्लोट32 टेंसर जिसमें बक्सों के लिए स्कोर होते हैं। |
स्टेटिक कंबाइंडनॉनमैक्ससप्रेशन.ऑप्शंस | पैडपेरक्लास (बूलियन पैडपेरक्लास) |
आउटपुट <पूर्णांक> | मान्य पहचान () एक [बैच_आकार] int32 टेंसर जो प्रति बैच आइटम के लिए मान्य पहचानों की संख्या दर्शाता है। |
विरासत में मिली विधियाँ
सार्वजनिक तरीके
सार्वजनिक स्थैतिक कंबाइंडनॉनमैक्ससप्रेशन.ऑप्शंस क्लिपबॉक्स (बूलियन क्लिपबॉक्स)
पैरामीटर
क्लिपबॉक्स | यदि सत्य है, तो मान लें कि बॉक्स निर्देशांक [0, 1] के बीच हैं और यदि वे [0, 1] से आगे गिरते हैं तो आउटपुट बॉक्स को क्लिप करें। यदि गलत है, तो क्लिपिंग न करें और बॉक्स निर्देशांक को वैसे ही आउटपुट करें जैसे वह है। |
---|
सार्वजनिक स्थैतिक कंबाइंडनॉनमैक्ससप्रेशन क्रिएट ( स्कोप स्कोप, ऑपरेंड <फ्लोट> बॉक्स, ऑपरेंड <फ्लोट> स्कोर, ऑपरेंड <इंटेगर> मैक्सऑउटपुटसाइजपरक्लास, ऑपरेंड <इंटेगर> मैक्सटोटलसाइज, ऑपरेंड <फ्लोट> आईओथ्रेशोल्ड, ऑपरेंड <फ्लोट> स्कोरथ्रेशोल्ड, ऑप्शन... विकल्प)
एक नए कंबाइंडनॉनमैक्ससप्रेशन ऑपरेशन को लपेटकर एक क्लास बनाने की फ़ैक्टरी विधि।
पैरामीटर
दायरा | वर्तमान दायरा |
---|---|
बक्से | `[batch_size, num_boxes, q, 4]` आकार का एक 4-डी फ्लोट टेंसर। यदि `q` 1 है तो सभी वर्गों के लिए समान बक्से का उपयोग किया जाता है अन्यथा, यदि `q` वर्गों की संख्या के बराबर है, तो वर्ग-विशिष्ट बक्से का उपयोग किया जाता है। |
स्कोर | `[बैच_आकार, संख्या_बॉक्स, संख्या_वर्ग]` आकार का एक 3-डी फ्लोट टेंसर प्रत्येक बॉक्स (बक्से की प्रत्येक पंक्ति) के अनुरूप एकल स्कोर का प्रतिनिधित्व करता है। |
maxOutputSizePerClass | एक अदिश पूर्णांक टेंसर, जो प्रति वर्ग गैर-अधिकतम दमन द्वारा चुने जाने वाले बक्सों की अधिकतम संख्या का प्रतिनिधित्व करता है |
अधिकतम कुल आकार | एक int32 अदिश सभी वर्गों में रखे गए बक्सों की अधिकतम संख्या का प्रतिनिधित्व करता है। ध्यान दें कि इस मान को बड़ी संख्या में सेट करने से सिस्टम वर्कलोड के आधार पर OOM त्रुटि हो सकती है। |
iouदहलीज | एक 0-डी फ्लोट टेंसर यह तय करने के लिए सीमा का प्रतिनिधित्व करता है कि क्या बॉक्स आईओयू के संबंध में बहुत अधिक ओवरलैप करते हैं। |
स्कोर सीमा | एक 0-डी फ्लोट टेंसर स्कोर के आधार पर बक्से को हटाने का निर्णय लेने के लिए सीमा का प्रतिनिधित्व करता है। |
विकल्प | वैकल्पिक गुण मान रखता है |
रिटर्न
- CombinedNonMaxSuppression का एक नया उदाहरण
सार्वजनिक आउटपुट <फ्लोट> nmsedBoxes ()
एक [बैच_आकार, अधिकतम_डिटेक्शन, 4] फ्लोट32 टेंसर जिसमें गैर-अधिकतम दबाए गए बक्से होते हैं।
सार्वजनिक आउटपुट <फ़्लोट> nmsedClasses ()
एक [बैच_आकार, अधिकतम_डिटेक्शन] फ्लोट32 टेंसर जिसमें बक्सों के लिए कक्षाएं शामिल हैं।
सार्वजनिक आउटपुट <फ्लोट> nmsedScores ()
एक [बैच_आकार, अधिकतम_डिटेक्शन] फ्लोट32 टेंसर जिसमें बक्सों के लिए स्कोर होते हैं।
सार्वजनिक स्थैतिक कंबाइंडनॉनमैक्ससप्रेशन.ऑप्शंस पैडपेरक्लास (बूलियन पैडपेरक्लास)
पैरामीटर
पैडपरक्लास | यदि गलत है, तो आउटपुट nmsed बॉक्स, स्कोर और क्लास को `max_total_size` पर पैड/क्लिप किया जाता है। यदि सही है, तो आउटपुट nmsed बॉक्स, स्कोर और क्लास की लंबाई `max_size_per_class`*`num_classes` है, जब तक कि यह `max_total_size` से अधिक न हो जाए, जिस स्थिति में इसे `max_total_size` पर क्लिप किया जाता है। डिफ़ॉल्ट से असत्य. |
---|
सार्वजनिक आउटपुट <पूर्णांक> वैधडिटेक्शन ()
एक [बैच_आकार] int32 टेंसर जो प्रति बैच आइटम के लिए मान्य पहचानों की संख्या दर्शाता है। nms_boxes[i], nms_scores[i] और nms_class[i] में केवल शीर्ष num_detections[i] प्रविष्टियाँ मान्य हैं। शेष प्रविष्टियाँ शून्य पैडिंग हैं।