Các tùy chọn để định cấu hình quy trình xử lý hình ảnh, hoạt động trước khi suy luận.
API Tầm nhìn của Thư viện Tác vụ thực hiện quá trình xử lý trước hình ảnh trên hình ảnh đầu vào trên vùng quan tâm sao cho phù hợp với các yêu cầu của mô hình (ví dụ: thẳng đứng 224x224 RGB) và điền vào tenxơ đầu vào tương ứng. Điều này được thực hiện bởi (theo thứ tự này):
- cắt vùng đệm khung thành vùng quan tâm (trong hầu hết các trường hợp, chỉ bao phủ toàn bộ hình ảnh đầu vào),
- thay đổi kích thước của nó (với phép nội suy song tuyến tính, tỷ lệ khung hình *không* được giữ nguyên) theo kích thước của tensor đầu vào mô hình,
- chuyển đổi nó thành không gian màu của tensor đầu vào (tức là RGB, hiện tại là không gian màu được hỗ trợ duy nhất),
- xoay nó theo
ImageProcessingOptions.Orientation
của nó để suy luận được thực hiện trên một hình ảnh "thẳng đứng".
QUAN TRỌNG: do việc cắt xén xảy ra trước tiên, vùng quan tâm được cung cấp được biểu thị trong khung không xoay của hệ tọa độ tham chiếu, tức là trong [0, TensorImage.getWidth()) x [0, TensorImage.getHeight())
, là kích thước của dữ liệu hình ảnh cơ bản trước khi áp dụng bất kỳ hướng nào. Nếu vùng nằm ngoài các giới hạn này, phương thức suy luận, chẳng hạn như ImageClassifier.classify(MlImage)
, sẽ trả về lỗi.
Các lớp lồng nhau
lớp học | ImageProcessingOptions.Builder | Trình tạo cho ImageProcessingOptions . | |
liệt kê | ImageProcessingOptions.Orientation | Loại định hướng tuân theo đặc tả EXIF. |
Nhà xây dựng công cộng
Phương pháp công cộng
ImageProcessingOptions.Builder tĩnh | |
trừu tượng ImageProcessingOptions.Orientation | |
hình chữ nhật trừu tượng | getRoi () |