GpuDelegateFactory.Options

공개 정적 클래스 GpuDelegateFactory.Options
알려진 직접 서브클래스

옵션을 위임합니다.

중첩 클래스

열거형 GpuDelegateFactory.Options.GpuBackend 선택할 GPU 백엔드.

상수

정수 INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER 위임은 한 번만 사용되므로 부트스트랩/초기화 시간을 고려해야 합니다.
정수 INFERENCE_PREFERENCE_SUSTAINED_SPEED 처리량을 최대화하는 것이 좋습니다.

공공 생성자

옵션 ()

공개 방법

부울
GpuDelegateFactory.Options.GpuBackend
정수
부울
GpuDelegateFactory.Options
setForceBackend ( GpuDelegateFactory.Options.GpuBackend forceBackend)
GPU 백엔드를 설정합니다.
GpuDelegateFactory.Options
setInferencePreference (정수 환경 설정)
정밀도/컴파일/런타임 균형을 위한 추론 기본 설정을 설정합니다.
GpuDelegateFactory.Options
setPrecisionLossAllowed (부울 정밀도LossAllowed)
정밀도 손실 허용 여부를 설정합니다.
GpuDelegateFactory.Options
setQuantizedModelsAllowed (부울 양자화모델 허용)
대리자를 사용하여 양자화된 모델을 실행할 수 있습니다.
GpuDelegateFactory.Options
setSerializationParams ( 문자열 serializationDir, 문자열 modelToken)
대리자에서 직렬화를 활성화합니다.

상속된 메서드

상수

공개 정적 최종 int INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER

위임은 한 번만 사용되므로 부트스트랩/초기화 시간을 고려해야 합니다.

상수값: 0

공개 정적 최종 int INFERENCE_PREFERENCE_SUSTAINED_SPEED

처리량을 최대화하는 것이 좋습니다. 여러 입력에서 동일한 대리자가 반복적으로 사용됩니다.

상수값: 1

공공 생성자

공개 옵션 ()

공개 방법

공개 부울 areQuantizedModelsAllowed ()

공개 GpuDelegateFactory.Options.GpuBackend getForceBackend ()

공개 int getInferencePreference ()

공개 문자열 getModelToken ()

공개 문자열 getSerializationDir ()

공개 부울 isPrecisionLossAllowed ()

공개 GpuDelegateFactory.Options setForceBackend ( GpuDelegateFactory.Options.GpuBackend forceBackend)

GPU 백엔드를 설정합니다.

매개변수
강제백엔드

public GpuDelegateFactory.Options setInferencePreference (int 환경 설정)

정밀도/컴파일/런타임 균형을 위한 추론 기본 설정을 설정합니다.

매개변수
선호 `INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER`(기본값), `INFERENCE_PREFERENCE_SUSTAINED_SPEED` 중 하나입니다.

공개 GpuDelegateFactory.Options setPrecisionLossAllowed (부울 정밀도LossAllowed)

정밀도 손실 허용 여부를 설정합니다.

매개변수
정밀도손실허용 'true'(기본값)인 경우 GPU는 FP16에서 텐서, 다운캐스트 값, 프로세스를 수량화할 수 있습니다. 'false'인 경우 계산은 32비트 부동 소수점으로 수행됩니다.

공개 GpuDelegateFactory.Options setQuantizedModelsAllowed (부울 yangizedModelsAllowed)

대리자를 사용하여 양자화된 모델을 실행할 수 있습니다.

경고: 이는 실험적인 API이며 변경될 수 있습니다.

매개변수
양자화된 모델이 허용됨 true (기본값)이면 GPU가 양자화된 모델을 실행할 수 있습니다.

공개 GpuDelegateFactory.Options setSerializationParams ( String serializationDir, String modelToken)

대리자에서 직렬화를 활성화합니다. 참고 직렬화에는 null이 아닌 serializationDirmodelToken 필요합니다.

경고: 이는 실험적인 API이며 변경될 수 있습니다.

매개변수
직렬화Dir 데이터를 저장하는 데 사용할 디렉터리입니다. 호출자는 모델이 공개 디렉터리에 저장되지 않았는지 확인할 책임이 있습니다. Android에서 애플리케이션에 대한 비공개 위치를 제공하려면 Context.getCodeCacheDir() 사용하는 것이 좋습니다.
모델토큰 모델을 식별하는 데 사용되는 토큰입니다. 호출자는 토큰이 모델 그래프 및 데이터에 대해 고유한지 확인할 책임이 있습니다.