گزینه هایی برای پیکربندی خط لوله پردازش تصویر، که قبل از استنتاج عمل می کند.
Task Library Vision API پیش پردازش تصویر را بر روی تصویر ورودی در ناحیه مورد نظر انجام می دهد، به طوری که با نیازهای مدل مطابقت داشته باشد (مثلا RGB 224x224 عمودی) و تانسور ورودی مربوطه را پر کند. این کار توسط (به این ترتیب) انجام می شود:
- برش بافر فریم به ناحیه مورد نظر (که در بیشتر موارد فقط کل تصویر ورودی را پوشش می دهد)،
- تغییر اندازه آن (با درون یابی دوخطی، نسبت ابعاد *حفظ نشده*) به ابعاد تانسور ورودی مدل،
- تبدیل آن به فضای رنگی تانسور ورودی (یعنی RGB، که در حال حاضر تنها فضای رنگی پشتیبانی شده است)،
- چرخاندن آن بر اساس
ImageProcessingOptions.Orientation
به طوری که استنتاج بر روی یک تصویر "راست" انجام شود.
مهم: در نتیجه برش ابتدا، ناحیه مورد نظر ارائه شده در سیستم مختصات مرجع چرخش نشده بیان می شود، به عنوان مثال در [0, TensorImage.getWidth()) x [0, TensorImage.getHeight())
که عبارتند از ابعاد داده های تصویر زیرین قبل از اعمال هر جهت. اگر منطقه خارج از این محدوده باشد، روش استنتاج، مانند ImageClassifier.classify(MlImage)
خطا را برمیگرداند.
کلاس های تو در تو
کلاس | ImageProcessingOptions.Builder | سازنده برای ImageProcessingOptions . | |
enum | ImageProcessingOptions.Orientation | نوع جهت گیری که از مشخصات EXIF پیروی می کند. |
سازندگان عمومی
روش های عمومی
استاتیک ImageProcessingOptions.Builder | سازنده () |
انتزاعی ImageProcessingOptions.Orientation | |
چکیده Rect | getRoi () |