Google I/O एक लपेट है! TensorFlow सत्रों पर पकड़ बनाएं सत्र देखें

टेंसरफ़्लो :: ऑप्स :: कंबाइंडनॉनमैक्ससिपेशन

#include <image_ops.h>

लालच स्कोर के अवरोही क्रम में बाउंडिंग बॉक्स के एक सबसेट का चयन करता है,।

सारांश

यह ऑपरेशन सभी वर्गों में प्रति बैच इनपुट पर non_max_suppression करता है। पहले से चयनित बॉक्स के साथ उच्च चौराहे-ओवर-यूनियन (IOU) ओवरलैप वाले बक्से को दूर करता है। बाउंडिंग बॉक्स को [y1, X1, y2, x2] के रूप में आपूर्ति की जाती है, जहां (y1, X1) और (y2, x2) किसी भी विकर्ण जोड़ी के कोनों के निर्देशांक होते हैं और निर्देशांक सामान्यीकृत (यानी, झूठ बोलकर) प्रदान किए जा सकते हैं अंतराल [0, 1]) या निरपेक्ष। ध्यान दें कि यह एल्गोरिथ्म अज्ञेय है जहां मूल समन्वय प्रणाली में है। यह भी ध्यान दें कि यह एल्गोरिथ्म समन्वय प्रणाली के ऑर्थोगोनल परिवर्तनों और अनुवादों के लिए अपरिवर्तनीय है; इस प्रकार समन्वय प्रणाली के अनुवाद या प्रतिबिंब का परिणाम एल्गोरिदम द्वारा चुने गए समान बक्से में होता है। इस ऑपरेशन का आउटपुट नॉन बॉक्स है, स्कोर और कक्षाएं टेनर non_max_suppression के प्रदर्शन के बाद लौटे।

तर्क:

  • गुंजाइश: एक स्कोप ऑब्जेक्ट
  • बक्से: आकार का एक 4-डी फ्लोट टेंसर [batch_size, num_boxes, q, 4] । यदि q 1 है तो सभी वर्गों के लिए एक ही बॉक्स का उपयोग किया जाता है अन्यथा, यदि q वर्गों की संख्या के बराबर है, तो वर्ग-विशिष्ट बक्से का उपयोग किया जाता है।
  • स्कोर: आकार का एक 3-डी फ्लोट टेंसर [batch_size, num_boxes, num_classes] प्रत्येक बॉक्स (बॉक्स की प्रत्येक पंक्ति) के लिए एक एकल स्कोर का प्रतिनिधित्व करता है।
  • max_output_size_per_class: प्रति वर्ग गैर अधिकतम दमन द्वारा चुने जाने वाले बॉक्स की अधिकतम संख्या का प्रतिनिधित्व करने वाला एक स्केलर पूर्णांक तन्यता
  • max_total_size: सभी वर्गों पर बनाए रखने वाले बॉक्स की अधिकतम संख्या का प्रतिनिधित्व करने वाला एक स्केलर।
  • iou_threshold: 0-D फ्लोट टेंसर यह तय करने के लिए दहलीज का प्रतिनिधित्व करता है कि बॉक्स IOU के संबंध में बहुत अधिक ओवरलैप करते हैं या नहीं।
  • score_threshold: 0-D फ्लोट टेंसर स्कोर के आधार पर बक्से निकालने के लिए निर्णय लेने के लिए दहलीज का प्रतिनिधित्व करता है।

वैकल्पिक विशेषताएँ ( Attrs देखें):

  • pad_per_class: यदि गलत है, तो आउटपुट nmsed बक्से, स्कोर और कक्षाएं गद्दीदार हो जाती हैं / max_total_size क्लिप हो max_total_size । अगर सही है तो उत्पादन nmsed बक्से, स्कोर और वर्गों लंबाई का होना गद्देदार हैं max_size_per_class * num_classes , जब तक यह अधिक है max_total_size जिस स्थिति में यह करने के लिए काटा गया है max_total_size । झूठे के लिए चूक।
  • clip_boxes: यदि सही है, तो मान लें कि बॉक्स निर्देशांक [0, 1] के बीच हैं और आउटपुट बक्से को क्लिप करते हैं यदि वे [0, 1] से परे हैं। यदि गलत है, तो क्लिपिंग न करें और बॉक्स निर्देशांक को आउटपुट करें जैसा कि यह है।

रिटर्न:

  • Output nmsed_boxes: एक [बैच_साइज, मैक्स_डेट्स, 4] फ्लोट 32 टेंसर जिसमें गैर-अधिकतम दबा हुआ बॉक्स है।
  • Output nmsed_scores: ए [बैच_साइज, मैक्स_डेट्स] फ्लोट 32 टेंसर बॉक्स के लिए स्कोर युक्त है।
  • Output nmsed_classes: A [बैच_साइज, मैक्स_डेट्स] फ्लोट 32 टेंसर बॉक्स के लिए क्लासेस युक्त है।
  • Output valid_detections: A [बैच_साइज़] int32 टेंसर प्रति बैच आइटम की वैध पहचान की संख्या को दर्शाता है। Nms_boxes [i], nms_scores [i] और nms_class [i] में केवल शीर्ष num_detections [i] प्रविष्टियां मान्य हैं। बाकी प्रविष्टियाँ शून्य पैडिंग हैं।

कंस्ट्रक्टर और डिस्ट्रक्टर्स

CombinedNonMaxSuppression (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size_per_class, :: tensorflow::Input max_total_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold)
CombinedNonMaxSuppression (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size_per_class, :: tensorflow::Input max_total_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, const CombinedNonMaxSuppression::Attrs & attrs)

सार्वजनिक विशेषताएँ

nmsed_boxes
nmsed_classes
nmsed_scores
operation
valid_detections

सार्वजनिक स्थैतिक कार्य

ClipBoxes (bool x)
PadPerClass (bool x)

संरचनाएं

टेंसोफ़्लो :: ऑप्स :: कंबाइंडनॉनमैक्ससिपेशन :: एट्र्स

वैकल्पिक विशेषता CombinedNonMaxSuppression के लिए व्यवस्थित होती है

सार्वजनिक विशेषताएँ

nmsed_boxes

::tensorflow::Output nmsed_boxes

nmsed_classes

::tensorflow::Output nmsed_classes

nmsed_scores

::tensorflow::Output nmsed_scores

ऑपरेशन

Operation operation

मान्य_डेट

::tensorflow::Output valid_detections

सार्वजनिक कार्य

कंबाइंडनॉनमैक्ससिपेशन

 CombinedNonMaxSuppression(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size_per_class,
  ::tensorflow::Input max_total_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold
)

कंबाइंडनॉनमैक्ससिपेशन

 CombinedNonMaxSuppression(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input boxes,
  ::tensorflow::Input scores,
  ::tensorflow::Input max_output_size_per_class,
  ::tensorflow::Input max_total_size,
  ::tensorflow::Input iou_threshold,
  ::tensorflow::Input score_threshold,
  const CombinedNonMaxSuppression::Attrs & attrs
)

सार्वजनिक स्थैतिक कार्य

क्लिपबॉक्स

Attrs ClipBoxes(
  bool x
)

PadPerClass

Attrs PadPerClass(
  bool x
)