GpuDelegateFactory.Options

public static class GpuDelegateFactory.Options
既知の直接サブクラス

委任オプション。

ネストされたクラス

列挙GpuDelegateFactory.Options.GpuBackend選択する GPU バックエンド。

定数

整数INFERENCE_PREFERENCE_FAST_SINGLE_ANSWERデリゲートは一度だけ使用されるため、ブートストラップ/初期化時間を考慮する必要があります。
整数INFERENCE_PREFERENCE_SUSTAINED_SPEEDスループットを最大化することを優先します。

パブリック コンストラクター

公開メソッド

ブール値
GpuDelegateFactory.Options.GpuBackend
整数
ブール値
GpuDelegateFactory.Options
setForceBackend ( GpuDelegateFactory.Options.GpuBackend forceBackend)
GPU バックエンドを設定します。
GpuDelegateFactory.Options
setInferencePreference (int プリファレンス)
精度/コンパイル/実行時のトレードオフの推論設定を設定します。
GpuDelegateFactory.Options
setPrecisionLossAllowed (boolean precisionLossAllowed)
桁落ちを許可するかどうかを設定します。
GpuDelegateFactory.Options
setQuantizedModelsAllowed (ブーリアン quantizedModelsAllowed)
デリゲートを使用して量子化されたモデルを実行できるようにします。
GpuDelegateFactory.Options
setSerializationParams (文字列serializationDir、文字列modelToken)
デリゲートでシリアル化を有効にします。

継承されたメソッド

定数

public static final int INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER

デリゲートは一度だけ使用されるため、ブートストラップ/初期化時間を考慮する必要があります。

定数値: 0

public static final int INFERENCE_PREFERENCE_SUSTAINED_SPEED

スループットを最大化することを優先します。同じデリゲートが複数の入力で繰り返し使用されます。

定数値: 1

パブリック コンストラクター

公開オプション()

公開メソッド

public boolean areQuantizedModelsAllowed ()

public GpuDelegateFactory.Options.GpuBackend getForceBackend ()

public int getInferencePreference ()

public String getModelToken ()

public String getSerializationDir ()

public boolean isPrecisionLossAllowed ()

public GpuDelegateFactory.Options setForceBackend ( GpuDelegateFactory.Options.GpuBackend forceBackend)

GPU バックエンドを設定します。

パラメーター
forceBackend

public GpuDelegateFactory.Options setInferencePreference (int プリファレンス)

精度/コンパイル/実行時のトレードオフの推論設定を設定します。

パラメーター
好みINFERENCE_PREFERENCE_FAST_SINGLE_ANSWER (デフォルト)、INFERENCE_PREFERENCE_SUSTAINED_SPEED のいずれか。

public GpuDelegateFactory.Options setPrecisionLossAllowed (boolean precisionLossAllowed)

桁落ちを許可するかどうかを設定します。

パラメーター
precisionLossAllowed true (デフォルト) の場合、GPU はテンソルを定量化し、値をダウンキャストし、FP16 で処理します。 false の場合、計算は 32 ビット浮動小数点で実行されます。

public GpuDelegateFactory.Options setQuantizedModelsAllowed (ブール値 quantizedModelsAllowed)

デリゲートを使用して量子化されたモデルを実行できるようにします。

警告: これは実験的な API であり、変更される可能性があります。

パラメーター
quantizedModelsAllowed true (デフォルト) の場合、GPU は量子化されたモデルを実行できます。

public GpuDelegateFactory.Options setSerializationParams (文字列serializationDir、文字列modelToken)

デリゲートでシリアル化を有効にします。シリアル化には、null 以外のserializationDirmodelTokenが必要であることに注意してください。

警告: これは実験的な API であり、変更される可能性があります。

パラメーター
シリアル化ディレクトリデータの保存に使用するディレクトリ。呼び出し元は、モデルがパブリック ディレクトリに格納されないようにする責任があります。 Context.getCodeCacheDir()を使用して、Android 上のアプリケーションにプライベートな場所を提供することをお勧めします。
モデルトークンモデルを識別するために使用されるトークン。呼び出し元は、トークンがモデル グラフとデータに対して一意であることを確認する責任があります。