यह ऑप arXiv:1506.01497 में eq.2 के अनुसार दिए गए बाउंडिंग बॉक्स (bbox_deltas) एन्कोडेड wrt एंकर से रुचि के क्षेत्र का उत्पादन करता है
ऑप शीर्ष `pre_nms_topn` स्कोरिंग बॉक्स का चयन करता है, उन्हें एंकर के संबंध में डिकोड करता है, `nms_threshold` से अधिक के साथ ओवरलैपिंग बॉक्स पर गैर-अधिकतम दमन लागू करता है, चौराहे-ओवर-यूनियन (आईओयू) मान, उन बॉक्स को छोड़ देता है जहां छोटा पक्ष `से कम होता है min_size`। इनपुट: `स्कोर`: आकार का एक 4D टेंसर [बैच, ऊंचाई, चौड़ाई, संख्या एंकर] जिसमें दिए गए स्थान पर प्रति एंकर स्कोर होता है `bbox_deltas`: आकार का एक टेंसर है [बैच, ऊंचाई, चौड़ाई, 4 x संख्या एंकर] प्रत्येक एंकर `एंकर` में एन्कोड किए गए बॉक्स: आकार का एक 1D टेंसर [4 x Num Anchors], जो एंकर का प्रतिनिधित्व करता है। आउटपुट: `rois`: आउटपुट RoIs, आकार का एक 3D टेंसर [बैच, post_nms_topn, 4], अगर post_nms_topn से कम उम्मीदवार मिले तो 0 से पैडेड। `roi_probabilities`: 'rois' में प्रत्येक roi का प्रायिकता स्कोर, आकार का एक 2D टेंसर [बैच, post_nms_topn], यदि आवश्यक हो तो 0 के साथ गद्देदार, स्कोर द्वारा क्रमबद्ध।
नेस्टेड कक्षाएं
कक्षा | जनरेट बाउंडिंगबॉक्सप्रस्ताव.विकल्प | के लिए वैकल्पिक विशेषताओं GenerateBoundingBoxProposals |
सार्वजनिक तरीके
स्थिर GenerateBoundingBoxProposals | बनाने ( स्कोप गुंजाइश, ओपेरैंड <फ्लोट> स्कोर, ओपेरैंड <फ्लोट> bboxDeltas, ओपेरैंड <फ्लोट> imageInfo, ओपेरैंड <फ्लोट> लंगर, ओपेरैंड <फ्लोट> nmsThreshold, ओपेरैंड <पूर्णांक> preNmsTopn, ओपेरैंड <फ्लोट> minSize, विकल्प .. । विकल्प) एक नया GenerateBoundingBoxProposals ऑपरेशन रैपिंग क्लास बनाने के लिए फ़ैक्टरी विधि। |
स्थिर GenerateBoundingBoxProposals.Options | postNmsTopn (लांग postNmsTopn) |
आउटपुट <फ्लोट> | roiProbabilities () आकार का एक 2-डी फ्लोट टेंसर `[num_images, post_nms_topn]` एक ही इंडेक्स पर `rois` टेंसर में रुचि बॉक्स के क्षेत्र के स्कोर का प्रतिनिधित्व करता है। |
आउटपुट <फ्लोट> | Rois () आकार का एक 3-डी फ्लोट टेंसर `[num_images,post_nms_topn,4]` ब्याज बॉक्स के चयनित क्षेत्र का प्रतिनिधित्व करता है। |
विरासत में मिली विधियां
सार्वजनिक तरीके
सार्वजनिक स्थिर GenerateBoundingBoxProposals बनाने ( स्कोप गुंजाइश, ओपेरैंड <फ्लोट> स्कोर, ओपेरैंड <फ्लोट> bboxDeltas, ओपेरैंड <फ्लोट> imageInfo, ओपेरैंड <फ्लोट> लंगर, ओपेरैंड <फ्लोट> nmsThreshold, ओपेरैंड <पूर्णांक> preNmsTopn, ओपेरैंड , <फ्लोट> minSize विकल्प ... विकल्प)
एक नया GenerateBoundingBoxProposals ऑपरेशन रैपिंग क्लास बनाने के लिए फ़ैक्टरी विधि।
मापदंडों
दायरा | वर्तमान दायरा |
---|---|
स्कोर | आकार का एक 4-डी फ्लोट टेंसर [num_images, ऊंचाई, चौड़ाई, num_achors]` दिए गए एंकर के लिए बॉक्स के स्कोर वाले, अनसोल्ड किए जा सकते हैं। |
बॉक्सडेल्टास | आकार का एक 4-डी फ्लोट टेंसर [num_images, ऊंचाई, चौड़ाई, 4 x num_anchors]`। प्रत्येक एंकर के संबंध में एन्कोडिंग बॉक्स। निर्देशांक [dy, dx, dh, dw] के रूप में दिए गए हैं। |
इमेजइन्फो | आकार का एक 2-डी फ्लोट टेंसर [num_images, 5] जिसमें छवि जानकारी ऊंचाई, चौड़ाई, स्केल शामिल है। |
एंकर | आकार का एक 2-डी फ्लोट टेंसर [num_anchors, 4] एंकर बॉक्स का वर्णन करता है। बक्से [y1, x1, y2, x2] के रूप में स्वरूपित होते हैं। |
एनएमएस दहलीज | गैर-अधिकतम-दमन सीमा के लिए एक अदिश फ्लोट टेंसर। |
प्रीएनएमएसटॉपन | इनपुट के रूप में उपयोग किए जाने वाले शीर्ष स्कोरिंग बॉक्स की संख्या के लिए एक स्केलर इंट टेंसर। |
न्यूनतम आकार | एक अदिश फ्लोट टेंसर। min_size से छोटे आकार वाले किसी भी बॉक्स को छोड़ दिया जाएगा। |
विकल्प | वैकल्पिक विशेषता मान रखता है |
रिटर्न
- GenerateBoundingBoxProposals का एक नया उदाहरण
सार्वजनिक स्थिर GenerateBoundingBoxProposals.Options postNmsTopn (लांग postNmsTopn)
मापदंडों
पोस्टएनएमएसटॉपन | पूर्णांक। आउटपुट में rois की अधिकतम संख्या। |
---|
सार्वजनिक आउटपुट <फ्लोट> roiProbabilities ()
आकार का एक 2-डी फ्लोट टेंसर `[num_images, post_nms_topn]` एक ही इंडेक्स पर `rois` टेंसर में रुचि बॉक्स के क्षेत्र के स्कोर का प्रतिनिधित्व करता है।
सार्वजनिक आउटपुट <फ्लोट> Rois ()
आकार का एक 3-डी फ्लोट टेंसर `[num_images,post_nms_topn,4]` ब्याज बॉक्स के चयनित क्षेत्र का प्रतिनिधित्व करता है। अंकों में अवरोही क्रम में क्रमबद्ध।