Các lớp con trực tiếp đã biết |
Tùy chọn đại biểu.
Các lớp lồng nhau
liệt kê | GpuDelegateFactory.Options.GpuBackend | Nên chọn phụ trợ GPU nào. |
Hằng số
int | INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER | Delegate sẽ chỉ được sử dụng một lần, do đó, cần tính đến thời gian bootstrap/init. |
int | INFERENCE_PREFERENCE_SUSTAINED_SPEED | Thích tối đa hóa thông lượng. |
Nhà xây dựng công cộng
Tùy chọn () |
Phương pháp công khai
boolean | |
GpuDelegateFactory.Options.GpuBackend | |
int | |
Sợi dây | |
Sợi dây | |
boolean | |
GpuDelegateFactory.Options | |
GpuDelegateFactory.Options | setInferencePreference (ưu tiên int) Đặt tùy chọn suy luận cho sự cân bằng độ chính xác/biên dịch/thời gian chạy. |
GpuDelegateFactory.Options | setPrecisionLossAllowed (boolean PrecisionLossAllowed) Đặt xem có cho phép mất độ chính xác hay không. |
GpuDelegateFactory.Options | setQuantizedModelsAllowed (boolean quantizedModelsAllowed) Cho phép chạy các mô hình lượng tử hóa với đại biểu. |
GpuDelegateFactory.Options | setSerializationParams ( Chuỗi serializationDir, Chuỗi modelToken) Cho phép tuần tự hóa trên đại biểu. |
Phương pháp kế thừa
Hằng số
int cuối cùng tĩnh công khai INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER
Delegate sẽ chỉ được sử dụng một lần, do đó, cần tính đến thời gian bootstrap/init.
int cuối cùng tĩnh công khai INFERENCE_PREFERENCE_SUSTAINED_SPEED
Thích tối đa hóa thông lượng. Cùng một đại biểu sẽ được sử dụng nhiều lần trên nhiều đầu vào.
Nhà xây dựng công cộng
Tùy chọn công khai ()
Phương pháp công khai
boolean công khai areQuantizedModelsAllowed ()
int công khai getInferencePreference ()
boolean công khai isPrecisionLossAllowed ()
công khai GpuDelegateFactory.Options setForceBackend ( GpuDelegateFactory.Options.GpuBackend ForceBackend)
Đặt phần cuối GPU.
Thông số
lực lượngBackend |
---|
công khai GpuDelegateFactory.Options setInferencePreference (tùy chọn int)
Đặt tùy chọn suy luận cho sự cân bằng độ chính xác/biên dịch/thời gian chạy.
Thông số
sự ưa thích | Một trong `INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER` (mặc định), `INFERENCE_PREFERENCE_SUSTAINED_SPEED`. |
---|
GpuDelegateFactory.Options setPrecisionLossAllowed công khai (boolean PrecisionLossAllowed)
Đặt xem có cho phép mất độ chính xác hay không.
Thông số
độ chính xácLossĐược phép | Khi `true` (mặc định), GPU có thể định lượng các tensor, giá trị downcast, xử lý trong FP16. Khi `false`, việc tính toán được thực hiện ở dạng dấu phẩy động 32-bit. |
---|
công khai GpuDelegateFactory.Options setQuantizedModelsAllowed (boolean quantizedModelsAllowed)
Cho phép chạy các mô hình lượng tử hóa với đại biểu.
CẢNH BÁO: Đây là API thử nghiệm và có thể thay đổi.
Thông số
lượng tử hóaModelsĐược phép | Khi true (mặc định), GPU có thể chạy các mô hình lượng tử hóa. |
---|
công khai GpuDelegateFactory.Options setSerializationParams ( String serializationDir, String modelToken)
Cho phép tuần tự hóa trên đại biểu. Lưu ý serializationDir
và modelToken
không null là bắt buộc để tuần tự hóa.
CẢNH BÁO: Đây là API thử nghiệm và có thể thay đổi.
Thông số
tuần tự hóaDir | Thư mục dùng để lưu trữ dữ liệu. Người gọi có trách nhiệm đảm bảo mô hình không được lưu trữ trong thư mục công cộng. Bạn nên sử dụng Context.getCodeCacheDir() để cung cấp vị trí riêng tư cho ứng dụng trên Android. |
---|---|
mô hìnhToken | Mã thông báo được sử dụng để xác định mô hình. Người gọi có trách nhiệm đảm bảo mã thông báo là duy nhất cho dữ liệu và biểu đồ mô hình. |