Các tùy chọn để định cấu hình đường ống xử lý hình ảnh, hoạt động trước khi suy luận.
API Tầm nhìn Thư viện Tác vụ thực hiện xử lý trước hình ảnh trên hình ảnh đầu vào qua vùng quan tâm, để nó phù hợp với yêu cầu của mô hình (ví dụ: thẳng đứng 224x224 RGB) và điền vào tenxơ đầu vào tương ứng. Điều này được thực hiện bởi (theo thứ tự này):
- cắt bộ đệm khung hình đến vùng quan tâm (trong hầu hết các trường hợp, chỉ bao gồm toàn bộ hình ảnh đầu vào),
- thay đổi kích thước nó (với nội suy song tuyến, tỷ lệ khung hình * không * được giữ nguyên) thành kích thước của tensor đầu vào mô hình,
- chuyển đổi nó thành không gian màu của tensor đầu vào (tức là RGB, là không gian màu duy nhất được hỗ trợ hiện tại),
- xoay nó theo mình
ImageProcessingOptions.Orientation
để suy luận được thực hiện trên một hình ảnh "thẳng đứng".
QUAN TRỌNG: do hậu quả của cắt xén xảy ra đầu tiên, khu vực cung cấp các lợi ích được thể hiện trong khung không xoay của tài liệu tham khảo hệ thống tọa độ, tức là trong [0, TensorImage.getWidth()) x [0, TensorImage.getHeight())
, đó là kích thước của dữ liệu hình ảnh cơ bản trước khi áp dụng bất kỳ hướng nào. Nếu khu vực này là ra khỏi những giới hạn, phương pháp suy luận, như ImageClassifier.classify(MlImage)
, sẽ trả về lỗi.
Lớp học lồng nhau
lớp | ImageProcessingOptions.Builder | Builder cho ImageProcessingOptions . | |
enum | ImageProcessingOptions.Orientation | Loại định hướng tuân theo đặc điểm kỹ thuật EXIF. |
Người xây dựng công cộng
Phương thức công khai
tĩnh ImageProcessingOptions.Builder | xây dựng () |
trừu tượng ImageProcessingOptions.Orientation | |
Rect trừu tượng | getRoi () |