GpuDelegateFactory.Options

общедоступный статический класс GpuDelegateFactory.Options
Известные прямые подклассы

Варианты делегирования.

Вложенные классы

перечисление GpuDelegateFactory.Options.GpuBackend Какой серверный процессор GPU выбрать.

Константы

интервал INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER Делегат будет использоваться только один раз, поэтому следует учитывать время загрузки/инициализации.
интервал INFERENCE_PREFERENCE_SUSTAINED_SPEED Предпочитаю максимизировать пропускную способность.

Публичные конструкторы

Публичные методы

логическое значение
GpuDelegateFactory.Options.GpuBackend
интервал
Нить
Нить
логическое значение
GpuDelegateFactory.Options
setForceBackend ( GpuDelegateFactory.Options.GpuBackend ForceBackend)
Устанавливает серверную часть графического процессора.
GpuDelegateFactory.Options
setInferencePreference (целое предпочтение)
Устанавливает предпочтение вывода для компромиссов между точностью/компиляцией/время выполнения.
GpuDelegateFactory.Options
setPrecisionLossAllowed (логическое значение точностиLossAllowed)
Устанавливает, разрешена ли потеря точности.
GpuDelegateFactory.Options
setQuantizedModelsAllowed (логическое значение quantizedModelsAllowed)
Позволяет запускать квантованные модели с делегатом.
GpuDelegateFactory.Options
setSerializationParams ( String seriesizationDir, String modelToken)
Включает сериализацию на делегате.

Унаследованные методы

Константы

public static Final int INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER

Делегат будет использоваться только один раз, поэтому следует учитывать время загрузки/инициализации.

Постоянное значение: 0

общедоступный статический окончательный int INFERENCE_PREFERENCE_SUSTAINED_SPEED

Предпочитаю максимизировать пропускную способность. Один и тот же делегат будет использоваться повторно на нескольких входах.

Постоянное значение: 1

Публичные конструкторы

общедоступные параметры ()

Публичные методы

общедоступное логическое значение areQuantizedModelsAllowed ()

public GpuDelegateFactory.Options.GpuBackend getForceBackend ()

public int getInferencePreference ()

публичная строка getModelToken ()

публичная строка getSerializationDir ()

общедоступное логическое значение isPrecisionLossAllowed ()

public GpuDelegateFactory.Options setForceBackend ( GpuDelegateFactory.Options.GpuBackend ForceBackend)

Устанавливает серверную часть графического процессора.

Параметры
ForceBackend

public GpuDelegateFactory.Options setInferencePreference (предпочтение int)

Устанавливает предпочтение вывода для компромиссов между точностью/компиляцией/время выполнения.

Параметры
предпочтение Один из `INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER` (по умолчанию), `INFERENCE_PREFERENCE_SUSTAINED_SPEED`.

public GpuDelegateFactory.Options setPrecisionLossAllowed (логическое значение PrecisionLossAllowed)

Устанавливает, разрешена ли потеря точности.

Параметры
точностьПотеряРазрешена Если установлено значение «истина» (по умолчанию), графический процессор может количественно определять тензоры, приводить значения и обрабатывать их в FP16. Если установлено значение «false», вычисления выполняются в 32-битном формате с плавающей запятой.

public GpuDelegateFactory.Options setQuantizedModelsAllowed (логическое значение quantizedModelsAllowed)

Позволяет запускать квантованные модели с делегатом.

ВНИМАНИЕ: это экспериментальный API, в который могут быть внесены изменения.

Параметры
квантованныеМоделиРазрешено Если установлено true (по умолчанию), графический процессор может запускать квантованные модели.

public GpuDelegateFactory.Options setSerializationParams ( StringserializationDir , String modelToken)

Включает сериализацию на делегате. Обратите внимание, что для сериализации требуются ненулевые serializationDir и modelToken .

ВНИМАНИЕ: это экспериментальный API, в который могут быть внесены изменения.

Параметры
сериализацияDir Каталог, который будет использоваться для хранения данных. Вызывающая сторона несет ответственность за то, чтобы модель не хранилась в общедоступном каталоге. Рекомендуется использовать Context.getCodeCacheDir() , чтобы предоставить частное расположение приложения на Android.
модельТокен Токен, который будет использоваться для идентификации модели. Вызывающая сторона несет ответственность за то, чтобы токен был уникальным для графа и данных модели.