tensorflow :: opérations :: CombinéNonMaxSuppression
#include <image_ops.h>
Sélectionne goulûment un sous-ensemble de boîtes englobantes par ordre décroissant de score.
Résumé
Cette opération effectue non_max_suppression sur les entrées par lot, dans toutes les classes. Élague les boîtes qui ont un chevauchement intersection-sur-union (IOU) élevé avec les boîtes précédemment sélectionnées. Les boîtes englobantes sont fournies sous la forme [y1, x1, y2, x2], où (y1, x1) et (y2, x2) sont les coordonnées de toute paire diagonale de coins de boîte et les coordonnées peuvent être fournies comme normalisées (c.-à-d. l'intervalle [0, 1]) ou absolu. Notez que cet algorithme est indépendant de l'emplacement de l'origine dans le système de coordonnées. Notez également que cet algorithme est invariant aux transformations orthogonales et aux traductions du système de coordonnées; ainsi, la traduction ou les réflexions du système de coordonnées entraînent la sélection des mêmes cases par l'algorithme. Le résultat de cette opération est le tenseur final des boîtes, des scores et des classes renvoyé après l'exécution de non_max_suppression.
Arguments:
- scope: un objet Scope
- boîtes: Un tenseur flottant 4-D de forme
[batch_size, num_boxes, q, 4]
. Siq
est 1 alors les mêmes cases sont utilisées pour toutes les classes sinon, siq
est égal au nombre de classes, des cases spécifiques à la classe sont utilisées. - scores: Un tenseur flottant 3-D de forme
[batch_size, num_boxes, num_classes]
représentant un seul score correspondant à chaque case (chaque rangée de cases). - max_output_size_per_class: Un tenseur scalaire entier représentant le nombre maximum de cases à sélectionner par suppression non max par classe
- max_total_size: un scalaire représentant le nombre maximum de cases conservées sur toutes les classes.
- iou_threshold: Un tenseur flottant 0-D représentant le seuil pour décider si les boîtes se chevauchent trop par rapport à l'IOU.
- score_threshold: un tenseur flottant 0-D représentant le seuil pour décider quand supprimer les boîtes en fonction du score.
Attributs facultatifs (voir Attrs
):
- pad_per_class: Si false, les boîtes, les scores et les classes nmsed en sortie sont remplis / découpés à
max_total_size
. Si la valeur est true, les cases nmsed, les scores et les classes de sortie sont remplis pour être de longueurmax_size_per_class
*num_classes
, sauf si elle dépassemax_total_size
auquel cas elle est coupée àmax_total_size
. La valeur par défaut est false. - clip_boxes: Si vrai, supposez que les coordonnées de la boîte sont entre [0, 1] et coupez les boîtes de sortie si elles tombent au-delà de [0, 1]. Si la valeur est false, n'effectuez pas de découpage et affichez les coordonnées de la boîte telles quelles.
Retour:
-
Output
nmsed_boxes: Un tenseur [batch_size, max_detections, 4] float32 contenant les boîtes non-max supprimées. -
Output
nmsed_scores: Un tenseur [batch_size, max_detections] float32 contenant les scores des boîtes. -
Output
nmsed_classes: Un tenseur [batch_size, max_detections] float32 contenant les classes des boîtes. -
Output
valid_detections: Un tenseur [batch_size] int32 indiquant le nombre de détections valides par lot. Seules les premières entrées num_detections [i] dans nms_boxes [i], nms_scores [i] et nms_class [i] sont valides. Le reste des entrées ne contient aucun rembourrage.
Constructeurs et destructeurs | |
---|---|
CombinedNonMaxSuppression (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size_per_class, :: tensorflow::Input max_total_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold) | |
CombinedNonMaxSuppression (const :: tensorflow::Scope & scope, :: tensorflow::Input boxes, :: tensorflow::Input scores, :: tensorflow::Input max_output_size_per_class, :: tensorflow::Input max_total_size, :: tensorflow::Input iou_threshold, :: tensorflow::Input score_threshold, const CombinedNonMaxSuppression::Attrs & attrs) |
Attributs publics | |
---|---|
nmsed_boxes | |
nmsed_classes | |
nmsed_scores | |
operation | |
valid_detections |
Fonctions statiques publiques | |
---|---|
ClipBoxes (bool x) | |
PadPerClass (bool x) |
Structs | |
---|---|
tensorflow :: ops :: CombinedNonMaxSuppression :: Attrs | Définisseurs d'attributs facultatifs pour CombinedNonMaxSuppression . |
Attributs publics
nmsed_boxes
::tensorflow::Output nmsed_boxes
nmsed_classes
::tensorflow::Output nmsed_classes
nmsed_scores
::tensorflow::Output nmsed_scores
opération
Operation operation
valid_detections
::tensorflow::Output valid_detections
Fonctions publiques
CombinéNonMaxSuppression
CombinedNonMaxSuppression( const ::tensorflow::Scope & scope, ::tensorflow::Input boxes, ::tensorflow::Input scores, ::tensorflow::Input max_output_size_per_class, ::tensorflow::Input max_total_size, ::tensorflow::Input iou_threshold, ::tensorflow::Input score_threshold )
CombinéNonMaxSuppression
CombinedNonMaxSuppression( const ::tensorflow::Scope & scope, ::tensorflow::Input boxes, ::tensorflow::Input scores, ::tensorflow::Input max_output_size_per_class, ::tensorflow::Input max_total_size, ::tensorflow::Input iou_threshold, ::tensorflow::Input score_threshold, const CombinedNonMaxSuppression::Attrs & attrs )
Fonctions statiques publiques
ClipBoxes
Attrs ClipBoxes( bool x )
PadPerClass
Attrs PadPerClass( bool x )