लालच से स्कोर के अवरोही क्रम में बाउंडिंग बॉक्स के सबसेट का चयन करता है,
यह ऑपरेशन सभी वर्गों में प्रति बैच इनपुट पर non_max_suppression करता है। उच्च चौराहा-ओवर-यूनियन (IOU) वाले बक्सों को पहले से चयनित बक्सों के साथ ओवरलैप करता है। बाउंडिंग बॉक्स की आपूर्ति [y1, x1, y2, x2] के रूप में की जाती है, जहां (y1, x1) और (y2, x2) बॉक्स कोनों के किसी भी विकर्ण जोड़ी के निर्देशांक हैं और निर्देशांक सामान्यीकृत के रूप में प्रदान किए जा सकते हैं। अंतराल [0, 1]) या निरपेक्ष। ध्यान दें कि यह एल्गोरिदम अज्ञेयवादी है जहां मूल समन्वय प्रणाली में है। यह भी ध्यान दें कि यह एल्गोरिथम समन्वय प्रणाली के ऑर्थोगोनल परिवर्तनों और अनुवादों के लिए अपरिवर्तनीय है; इस प्रकार समन्वय प्रणाली के अनुवाद या प्रतिबिंब के परिणामस्वरूप एल्गोरिदम द्वारा समान बक्से का चयन किया जाता है। इस ऑपरेशन का आउटपुट नॉन_मैक्स_सुप्रेशन करने के बाद लौटाए गए अंतिम बॉक्स, स्कोर और क्लास टेंसर है।
नेस्टेड कक्षाएं
कक्षा | संयुक्तनॉनमैक्ससुप्रेशन.विकल्प | के लिए वैकल्पिक विशेषताओं CombinedNonMaxSuppression |
सार्वजनिक तरीके
स्थिर CombinedNonMaxSuppression.Options | clipBoxes (बूलियन clipBoxes) |
स्थिर CombinedNonMaxSuppression | बनाने ( स्कोप गुंजाइश, ओपेरैंड <फ्लोट> बक्से, ओपेरैंड <फ्लोट> स्कोर, ओपेरैंड <पूर्णांक> maxOutputSizePerClass, ओपेरैंड <पूर्णांक> maxTotalSize, ओपेरैंड <फ्लोट> iouThreshold, ओपेरैंड <फ्लोट> scoreThreshold, विकल्प ... विकल्प) एक नया कंबाइंड नॉनमैक्ससुप्रेशन ऑपरेशन रैपिंग क्लास बनाने के लिए फ़ैक्टरी विधि। |
आउटपुट <फ्लोट> | nmsedBoxes () एक [बैच_साइज़, मैक्स_डिटेक्शन, 4] फ्लोट32 टेंसर जिसमें गैर-अधिकतम दबाए गए बॉक्स होते हैं। |
आउटपुट <फ्लोट> | nmsedClasses () एक [बैच_साइज़, मैक्स_डिटेक्शन] फ्लोट32 टेंसर जिसमें बॉक्स के लिए कक्षाएं होती हैं। |
आउटपुट <फ्लोट> | nmsedScores () एक [बैच_साइज़, मैक्स_डिटेक्शन] फ्लोट32 टेंसर जिसमें बॉक्स के लिए स्कोर होते हैं। |
स्थिर CombinedNonMaxSuppression.Options | padPerClass (बूलियन padPerClass) |
आउटपुट <पूर्णांक> | validDetections () एक [बैच_साइज़] int32 टेंसर प्रति बैच आइटम के लिए मान्य डिटेक्शन की संख्या दर्शाता है। |
विरासत में मिली विधियां
सार्वजनिक तरीके
सार्वजनिक स्थिर CombinedNonMaxSuppression.Options clipBoxes (बूलियन clipBoxes)
मापदंडों
क्लिपबॉक्स | यदि सही है, तो मान लें कि बॉक्स निर्देशांक [0, 1] के बीच हैं और आउटपुट बॉक्स को क्लिप करें यदि वे [0, 1] से आगे आते हैं। यदि गलत है, तो क्लिपिंग न करें और बॉक्स निर्देशांक को वैसे ही आउटपुट करें जैसे वह है। |
---|
सार्वजनिक स्थिर CombinedNonMaxSuppression बनाने ( स्कोप गुंजाइश, ओपेरैंड <फ्लोट> बक्से, ओपेरैंड <फ्लोट> स्कोर, ओपेरैंड <पूर्णांक> maxOutputSizePerClass, ओपेरैंड <पूर्णांक> maxTotalSize, ओपेरैंड <फ्लोट> iouThreshold, ओपेरैंड <फ्लोट> scoreThreshold, विकल्प ... विकल्प)
एक नया कंबाइंड नॉनमैक्ससुप्रेशन ऑपरेशन रैपिंग क्लास बनाने के लिए फ़ैक्टरी विधि।
मापदंडों
दायरा | वर्तमान दायरा |
---|---|
बक्से | आकार का एक 4-डी फ्लोट टेंसर [बैच_साइज, num_boxes, q, 4]`। यदि `q` 1 है तो सभी वर्गों के लिए समान बक्से का उपयोग किया जाता है अन्यथा, यदि `q` वर्गों की संख्या के बराबर है, तो वर्ग-विशिष्ट बक्से का उपयोग किया जाता है। |
स्कोर | आकार का एक 3-डी फ्लोट टेंसर `[बैच_साइज, num_boxes, num_classes]` प्रत्येक बॉक्स (बॉक्स की प्रत्येक पंक्ति) के अनुरूप एकल स्कोर का प्रतिनिधित्व करता है। |
maxOutputSizePerClass | एक अदिश पूर्णांक टेंसर प्रति वर्ग गैर अधिकतम दमन द्वारा चुने जाने वाले बक्सों की अधिकतम संख्या का प्रतिनिधित्व करता है |
अधिकतम कुल आकार | एक int32 स्केलर जो सभी वर्गों में रखे गए बक्सों की अधिकतम संख्या का प्रतिनिधित्व करता है। ध्यान दें कि इस मान को बड़ी संख्या में सेट करने से सिस्टम वर्कलोड के आधार पर OOM त्रुटि हो सकती है। |
मैं दहलीज | 0-डी फ्लोट टेंसर यह तय करने के लिए थ्रेशोल्ड का प्रतिनिधित्व करता है कि क्या बॉक्स IOU के संबंध में बहुत अधिक ओवरलैप करते हैं। |
स्कोर दहलीज | स्कोर के आधार पर बॉक्स को कब निकालना है, यह तय करने के लिए थ्रेशोल्ड का प्रतिनिधित्व करने वाला 0-डी फ्लोट टेंसर। |
विकल्प | वैकल्पिक विशेषता मान रखता है |
रिटर्न
- CombedNonMaxSuppression का एक नया उदाहरण
सार्वजनिक आउटपुट <फ्लोट> nmsedBoxes ()
एक [बैच_साइज़, मैक्स_डिटेक्शन, 4] फ्लोट32 टेंसर जिसमें गैर-अधिकतम दबाए गए बॉक्स होते हैं।
सार्वजनिक आउटपुट <फ्लोट> nmsedClasses ()
एक [बैच_साइज़, मैक्स_डिटेक्शन] फ्लोट32 टेंसर जिसमें बॉक्स के लिए कक्षाएं होती हैं।
सार्वजनिक आउटपुट <फ्लोट> nmsedScores ()
एक [बैच_साइज़, मैक्स_डिटेक्शन] फ्लोट32 टेंसर जिसमें बॉक्स के लिए स्कोर होते हैं।
सार्वजनिक स्थिर CombinedNonMaxSuppression.Options padPerClass (बूलियन padPerClass)
मापदंडों
पैडपरक्लास | यदि गलत है, तो आउटपुट nmsed बॉक्स, स्कोर और क्लास को गद्देदार/क्लिप करके `max_total_size` कर दिया जाता है। अगर सही है, तो आउटपुट nmsed बॉक्स, स्कोर और क्लास को `max_size_per_class`*`num_classes` लंबाई का पैडेड किया जाता है, जब तक कि यह `max_total_size` से अधिक न हो, जिस स्थिति में इसे `max_total_size` पर क्लिप किया जाता है। असत्य के लिए डिफ़ॉल्ट। |
---|
सार्वजनिक आउटपुट <पूर्णांक> validDetections ()
एक [बैच_साइज़] int32 टेंसर प्रति बैच आइटम के लिए मान्य डिटेक्शन की संख्या दर्शाता है। nms_boxes[i], nms_scores[i] और nms_class[i] में केवल शीर्ष num_detections[i] प्रविष्टियां मान्य हैं। शेष प्रविष्टियां शून्य पैडिंग हैं।