Opciones para configurar el proceso de procesamiento de imágenes, que opera antes de la inferencia.
La API Task Library Vision realiza un preprocesamiento de la imagen de entrada en la región de interés, de modo que se ajuste a los requisitos del modelo (por ejemplo, 224x224 RGB vertical) y complete el tensor de entrada correspondiente. Esto lo realizan (en este orden):
- recortar el búfer de fotogramas a la región de interés (que, en la mayoría de los casos, solo cubre toda la imagen de entrada),
- cambiar su tamaño (con interpolación bilineal, relación de aspecto *no* preservada) a las dimensiones del tensor de entrada del modelo,
- convirtiéndolo al espacio de color del tensor de entrada (es decir, RGB, que es el único espacio de color admitido por ahora),
- girándolo de acuerdo con su
ImageProcessingOptions.Orientation
para que la inferencia se realice en una imagen "vertical".
IMPORTANTE: como consecuencia de que el recorte se produce primero, la región de interés proporcionada se expresa en el sistema de coordenadas del marco de referencia no rotado, es decir, en [0, TensorImage.getWidth()) x [0, TensorImage.getHeight())
, que son las dimensiones de los datos de la imagen subyacente antes de aplicar cualquier orientación. Si la región está fuera de estos límites, el método de inferencia, como ImageClassifier.classify(MlImage)
, devolverá un error.
Clases anidadas
clase | Opciones de procesamiento de imágenes.Builder | Constructor para ImageProcessingOptions . | |
enumeración | ImageProcessingOptions.Orientación | Tipo de orientación que sigue la especificación EXIF. |
Constructores Públicos
Métodos públicos
ImageProcessingOptions.Builder estático | constructor () |
Resumen ImageProcessingOptions.Orientation | |
recto abstracto | obtenerRoi () |