Opções para configurar o pipeline de processamento de imagem, que opera antes da inferência.
A API Task Library Vision realiza o pré-processamento da imagem na imagem de entrada na região de interesse, de modo que se ajuste aos requisitos do modelo (por exemplo, RGB 224x224 vertical) e preencha o tensor de entrada correspondente. Isso é realizado por (nesta ordem):
- recortar o buffer de quadros para a região de interesse (que, na maioria dos casos, cobre apenas a imagem de entrada inteira),
- redimensioná-lo (com interpolação bilinear, proporção de aspecto * não * preservado) para as dimensões do tensor de entrada do modelo,
- convertendo-o para o espaço de cor do tensor de entrada (ou seja, RGB, que é o único espaço de cor suportado por enquanto),
- rodando-a de acordo com a sua
ImageProcessingOptions.Orientation
modo que inferência é realizado em uma imagem "na posição vertical".
Importante: como uma consequência de corte que ocorrem em primeiro lugar, a região prevista de interesse é expresso no quadro sem rotação do sistema de coordenadas de referência, ou seja, em [0, TensorImage.getWidth()) x [0, TensorImage.getHeight())
, que são as dimensões dos dados da imagem subjacente antes que qualquer orientação seja aplicada. Se a região está fora desses limites, o método de inferência, tais como ImageClassifier.classify(MlImage)
, retornará de erro.
Classes aninhadas
classe | ImageProcessingOptions.Builder | Builder para ImageProcessingOptions . | |
enum | ImageProcessingOptions.Orientation | Tipo de orientação que segue a especificação EXIF. |
Construtores Públicos
Métodos Públicos
estática ImageProcessingOptions.Builder | Construtor () |
abstrato ImageProcessingOptions.Orientation | |
Rect abstrato | getRoi () |