パブリック抽象クラスImageProcessingOptions
推論前に動作する画像処理パイプラインを構成するオプション。
Task Library Vision API は、モデル要件 (例: 正立 224x224 RGB) に適合し、対応する入力テンソルを設定するために、関心領域上の入力画像に対して画像前処理を実行します。これは (この順序で) 次のように実行されます。
- フレーム バッファーを対象領域にトリミングします (ほとんどの場合、入力画像全体がカバーされるだけです)。
- (双一次補間を使用し、アスペクト比は「保持されません」)、モデル入力テンソルの次元に合わせてサイズ変更します。
- それを入力テンソルの色空間 (つまり、現時点でサポートされている唯一の色空間である RGB) に変換します。
-
ImageProcessingOptions.Orientation
に従って回転させて、推論が「正立」画像で実行されるようにします。
重要: 最初にトリミングが行われた結果、指定された関心領域は、参照座標系の回転されていないフレーム、つまり[0, TensorImage.getWidth()) x [0, TensorImage.getHeight())
で表現されます。方向が適用される前の、基礎となる画像データの寸法。領域がこれらの境界外にある場合、 ImageClassifier.classify(MlImage)
などの推論メソッドはエラーを返します。
ネストされたクラス
クラス | ImageProcessingOptions.Builder | ImageProcessingOptions のビルダー。 | |
列挙型 | ImageProcessingOptions.Orientation | EXIF の仕様に従う方向のタイプ。 |
パブリックコンストラクター
パブリックメソッド
静的ImageProcessingOptions.Builder | ビルダー() |
抽象的なImageProcessingOptions.Orientation | |
抽象的な長方形 | ゲットロイ() |