این عملیات منطقه علایق را از جعبههای مرزبندی داده شده (bbox_deltas) لنگرهای wrt کدگذاری شده مطابق معادله 2 در arXiv:1506.01497 تولید میکند.
این عملیات، جعبههای امتیازدهی برتر «pre_nms_topn» را انتخاب میکند، آنها را با توجه به لنگرها رمزگشایی میکند، در جعبههای همپوشانی با مقدار تقاطع بیش از «nms_threshold» بالاتر از «nms_threshold»، جعبههایی را که ضلع کوتاهتر از «» کمتر است، اعمال میکند. min_size`. ورودیها: «نمرات»: یک تانسور 4 بعدی شکل [Batch, Height, Width, Num Anchors] حاوی امتیازات هر لنگر در موقعیت داده شده «bbox_deltas»: یک تانسور شکل است [Batch, Height, Width, 4 x Num Anchors] جعبههای کدگذاری شده برای هر لنگر «لنگر»: یک تانسور 1 بعدی شکل [4 x Num Anchors] که نشان دهنده لنگرها است. خروجیها: `rois`: RoIهای خروجی، یک تانسور سهبعدی شکل [Batch, post_nms_topn, 4]، در صورتی که کمتر از نامزدهای post_nms_topn یافت شود، با 0 پر شده است. "احتمالات_roi": امتیازهای احتمالی هر roi در "rois"، یک تانسور دوبعدی شکل [Batch,post_nms_topn]، در صورت نیاز با 0 پر شده و بر اساس امتیازها مرتب شده است.
کلاس های تو در تو
کلاس | GenerateBoundingBoxProposals.Options | ویژگی های اختیاری برای GenerateBoundingBoxProposals |
روش های عمومی
استاتیک GenerateBoundingBoxProposals | ایجاد ( دامنه دامنه ، امتیازهای عملوند <Float>، عملوند <Float> bboxDeltas، عملوند <Float> imageInfo، عملوند <Float> anchors، عملوند <Float> nmsThreshold، عملوند <Integer> preNmsTopn، عملوند <Float> minSize، گزینهها. . گزینه ها) روش کارخانه برای ایجاد کلاسی که یک عملیات GenerateBoundingBoxProposals جدید را بسته بندی می کند. |
استاتیک GenerateBoundingBoxProposals.Options | postNmsTopn (پستNmsTopn طولانی) |
خروجی <Float> | roiProbabilities () یک تانسور شناور دوبعدی به شکل «[تعداد_تصاویر، post_nms_topn]» که نشان دهنده امتیاز کادر ناحیه مورد نظر در تانسور «rois» در همان شاخص است. |
خروجی <Float> | rois () یک تانسور شناور سه بعدی به شکل «[num_images,post_nms_topn,4]» که ناحیه انتخابی کادرهای مورد علاقه را نشان می دهد. |
روش های ارثی
روش های عمومی
GenerateBoundingBoxProposals عمومی استاتیک ایجاد می کند ( دامنه دامنه ، امتیازهای عملوند <Float>، عملوند <Float> bboxDeltas، عملوند <Float> imageInfo، عملوند <Float> لنگرها، عملوند <Float> nmsThreshold، عملوند <Integer> عملوند preNmsToploat> گزینه ها ... گزینه ها)
روش کارخانه برای ایجاد کلاسی که یک عملیات GenerateBoundingBoxProposals جدید را بسته بندی می کند.
مولفه های
محدوده | محدوده فعلی |
---|---|
امتیازات | یک تانسور شناور چهاربعدی به شکل «[تعداد_تصاویر، ارتفاع، عرض، تعداد_آکورها]» که حاوی امتیازهایی از کادرهای لنگرهای داده شده است، میتواند مرتبسازی نشود. |
bboxDeltas | یک تانسور شناور 4 بعدی با شکل «[تعداد_تصاویر، ارتفاع، عرض، 4 x num_anchors]». جعبه های رمزگذاری با توجه به هر لنگر. مختصات به شکل [dy، dx، dh، dw] آورده شده است. |
اطلاعات تصویری | یک تانسور شناور دوبعدی به شکل «[تعداد_تصاویر، 5]» حاوی اطلاعات تصویر ارتفاع، عرض، مقیاس. |
لنگرها | یک تانسور شناور دوبعدی به شکل «[num_anchors, 4]» که جعبههای لنگر را توصیف میکند. جعبه ها به شکل [y1, x1, y2, x2] فرمت می شوند. |
nmsThreshold | یک تانسور شناور اسکالر برای آستانه سرکوب غیر حداکثری. |
preNmsTopn | یک تانسور اسکالر برای تعداد کادرهای امتیازدهی برتر که به عنوان ورودی استفاده می شود. |
اندازه کوچک | یک تانسور شناور اسکالر. هر جعبه ای که اندازه کوچکتر از min_size داشته باشد دور انداخته می شود. |
گزینه ها | مقادیر ویژگی های اختیاری را حمل می کند |
برمی گرداند
- یک نمونه جدید از GenerateBoundingBoxProposals
عمومی استاتیک GenerateBoundingBoxProposals.Options postNmsTopn (Long postNmsTopn)
مولفه های
postNmsTopn | یک عدد صحیح حداکثر تعداد rois در خروجی. |
---|
خروجی عمومی <Float> roiProbabilities ()
یک تانسور شناور دوبعدی به شکل «[تعداد_تصاویر، post_nms_topn]» که نشان دهنده امتیاز کادر ناحیه مورد نظر در تانسور «rois» در همان شاخص است.
خروجی عمومی <Float> rois ()
یک تانسور شناور سه بعدی به شکل «[num_images,post_nms_topn,4]» که ناحیه انتخابی کادرهای مورد علاقه را نشان می دهد. به ترتیب نزولی در نمرات مرتب شده است.