ImageProcessingOptions

パブリック抽象クラスImageProcessingOptions

推論前に動作する画像処理パイプラインを構成するオプション。

Task Library Vision API は、モデル要件 (例: 正立 224x224 RGB) に適合し、対応する入力テンソルを設定するために、関心領域上の入力画像に対して画像前処理を実行します。これは (この順序で) 次のように実行されます。

  • フレーム バッファーを対象領域にトリミングします (ほとんどの場合、入力画像全体がカバーされるだけです)。
  • (双一次補間を使用し、アスペクト比は「保持されません」)、モデル入力テンソルの次元に合わせてサイズ変更します。
  • それを入力テンソルの色空間 (つまり、現時点でサポートされている唯一の色空間である RGB) に変換します。
  • ImageProcessingOptions.Orientationに従って回転させて、推論が「正立」画像で実行されるようにします。

重要: 最初にトリミングが行われた結果、指定された関心領域は、参照座標系の回転されていないフレーム、つまり[0, TensorImage.getWidth()) x [0, TensorImage.getHeight())で表現されます。方向が適用される前の、基礎となる画像データの寸法。領域がこれらの境界外にある場合、 ImageClassifier.classify(MlImage)などの推論メソッドはエラーを返します。

ネストされたクラス

クラスImageProcessingOptions.Builder ImageProcessingOptionsのビルダー。
列挙型ImageProcessingOptions.Orientation EXIF の仕様に従う方向のタイプ。

パブリックコンストラクター

パブリックメソッド

静的ImageProcessingOptions.Builder
抽象的なImageProcessingOptions.Orientation
抽象的な長方形

継承されたメソッド

パブリックコンストラクター

public ImageProcessingOptions ()

パブリックメソッド

public static ImageProcessingOptions.Builderビルダー()

public abstract ImageProcessingOptions.Orientation getOrientation ()

パブリックアブストラクト Rect getRoi ()