GpuDelegateFactory.Options

classe statique publique GpuDelegateFactory.Options
Sous-classes directes connues

Options de délégation.

Classes imbriquées

énumération GpuDelegateFactory.Options.GpuBackend Quel backend GPU sélectionner.

Constantes

int INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER Le délégué ne sera utilisé qu'une seule fois, par conséquent, le temps d'amorçage/d'initialisation doit être pris en compte.
int INFERENCE_PREFERENCE_SUSTAINED_SPEED Préférez maximiser le débit.

Constructeurs Publics

Options ()

Méthodes publiques

booléen
GpuDelegateFactory.Options.GpuBackend
int
Chaîne
Chaîne
booléen
GpuDelegateFactory.Options
setForceBackend ( GpuDelegateFactory.Options.GpuBackend forceBackend)
Définit le backend GPU.
GpuDelegateFactory.Options
setInferencePreference (préférence int)
Définit la préférence d’inférence pour les compromis précision/compilation/exécution.
GpuDelegateFactory.Options
setPrecisionLossAllowed (précision booléenneLossAllowed)
Définit si la perte de précision est autorisée.
GpuDelegateFactory.Options
setQuantizedModelsAllowed (booléen quantizedModelsAllowed)
Permet d'exécuter des modèles quantifiés avec le délégué.
GpuDelegateFactory.Options
setSerializationParams ( String serializationDir, String modelToken)
Active la sérialisation sur le délégué.

Méthodes héritées

Constantes

public statique final int INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER

Le délégué ne sera utilisé qu'une seule fois, par conséquent, le temps d'amorçage/d'initialisation doit être pris en compte.

Valeur constante : 0

public statique final int INFERENCE_PREFERENCE_SUSTAINED_SPEED

Préférez maximiser le débit. Le même délégué sera utilisé à plusieurs reprises sur plusieurs entrées.

Valeur constante : 1

Constructeurs Publics

Options publiques ()

Méthodes publiques

public booléen areQuantizedModelsAllowed ()

public GpuDelegateFactory.Options.GpuBackend getForceBackend ()

public int getInferencePreference ()

chaîne publique getModelToken ()

chaîne publique getSerializationDir ()

public booléen isPrecisionLossAllowed ()

public GpuDelegateFactory.Options setForceBackend ( GpuDelegateFactory.Options.GpuBackend forceBackend)

Définit le backend GPU.

Paramètres
forceBackend

public GpuDelegateFactory.Options setInferencePreference (int préférence)

Définit la préférence d’inférence pour les compromis précision/compilation/exécution.

Paramètres
préférence L'un des `INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER` (par défaut), `INFERENCE_PREFERENCE_SUSTAINED_SPEED`.

public GpuDelegateFactory.Options setPrecisionLossAllowed (booléen PrecisionLossAllowed)

Définit si la perte de précision est autorisée.

Paramètres
précisionPerteAutorisée Lorsqu'il est « vrai » (par défaut), le GPU peut quantifier les tenseurs, les valeurs abaissées et les traiter dans le FP16. Lorsque « faux », les calculs sont effectués en virgule flottante 32 bits.

public GpuDelegateFactory.Options setQuantizedModelsAllowed (booléen quantizedModelsAllowed)

Permet d'exécuter des modèles quantifiés avec le délégué.

AVERTISSEMENT : Il s'agit d'une API expérimentale et susceptible d'être modifiée.

Paramètres
quantizedModèlesAutorisés Lorsque true (par défaut), le GPU peut exécuter des modèles quantifiés.

public GpuDelegateFactory.Options setSerializationParams ( String serializationDir, String modelToken)

Active la sérialisation sur le délégué. Notez que serializationDir et modelToken non nuls sont requis pour la sérialisation.

AVERTISSEMENT : Il s'agit d'une API expérimentale et susceptible d'être modifiée.

Paramètres
sérialisationDir Le répertoire à utiliser pour stocker les données. L'appelant est responsable de s'assurer que le modèle n'est pas stocké dans un répertoire public. Il est recommandé d'utiliser Context.getCodeCacheDir() pour fournir un emplacement privé pour l'application sur Android.
modèleJeton Le jeton à utiliser pour identifier le modèle. L’appelant est responsable de s’assurer que le jeton est unique par rapport au graphique et aux données du modèle.