Options pour configurer le pipeline de traitement d'image, qui fonctionne avant l'inférence.
L'API Task Library Vision effectue un prétraitement d'image sur l'image d'entrée sur la région d'intérêt, afin qu'elle corresponde aux exigences du modèle (par exemple, 224 x 224 RVB vertical) et remplit le tenseur d'entrée correspondant. Ceci est effectué par (dans cet ordre) :
- recadrer le frame buffer sur la région d'intérêt (qui, dans la plupart des cas, ne couvre que la totalité de l'image d'entrée),
- le redimensionner (avec interpolation bilinéaire, rapport hauteur/largeur *non* conservé) aux dimensions du tenseur d'entrée du modèle,
- en le convertissant dans l'espace colorimétrique du tenseur d'entrée (c'est-à-dire RVB, qui est le seul espace colorimétrique pris en charge pour l'instant),
- faites-le pivoter en fonction de son
ImageProcessingOptions.Orientation
afin que l'inférence soit effectuée sur une image "droite".
IMPORTANT : en raison du recadrage effectué en premier, la région d'intérêt fournie est exprimée dans le système de coordonnées de référence non pivoté, c'est-à-dire dans [0, TensorImage.getWidth()) x [0, TensorImage.getHeight())
, qui sont les dimensions des données d'image sous-jacentes avant qu'une orientation ne soit appliquée. Si la région est en dehors de ces limites, la méthode d'inférence, telle que ImageClassifier.classify(MlImage)
, renverra une erreur.
Classes imbriquées
classe | ImageProcessingOptions.Builder | Générateur pour ImageProcessingOptions . | |
énumération | ImageProcessingOptions.Orientation | Type d'orientation qui suit la spécification EXIF. |
Constructeurs Publics
Méthodes publiques
statique ImageProcessingOptions.Builder | constructeur () |
abstrait ImageProcessingOptions.Orientation | |
résumé Rect | getRoi () |