Các lớp con trực tiếp đã biết |
Tùy chọn ủy quyền.
Các lớp lồng nhau
liệt kê | GpuDelegateFactory.Options.GpuBackend | Chọn chương trình phụ trợ GPU nào. |
hằng số
int | INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER | Đại biểu sẽ chỉ được sử dụng một lần, do đó, nên tính đến thời gian bootstrap/init. |
int | INFERENCE_PREFERENCE_SUSTAINED_SPEED | Thích tối đa hóa thông lượng. |
Nhà thầu công cộng
Tùy chọn () |
Phương thức công khai
boolean | |
GpuDelegateFactory.Options.GpuBackend | |
int | |
Sợi dây | |
Sợi dây | |
boolean | |
GpuDelegateFactory.Options | |
GpuDelegateFactory.Options | setInferencePreference (ưu tiên int) Đặt tùy chọn suy luận cho sự cân bằng độ chính xác/biên dịch/thời gian chạy. |
GpuDelegateFactory.Options | setPrecisionLossAllowed (boolean precisionLossAllowed) Đặt xem có cho phép mất độ chính xác hay không. |
GpuDelegateFactory.Options | setQuantizedModelsAllowed (boolean quantizedModelsAllowed) Cho phép chạy các mô hình lượng tử hóa với đại biểu. |
GpuDelegateFactory.Options | setSerializationParams ( String serializationDir, String modelToken) Cho phép tuần tự hóa trên đại biểu. |
Phương thức kế thừa
hằng số
int tĩnh cuối cùng công khai INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER
Đại biểu sẽ chỉ được sử dụng một lần, do đó, nên tính đến thời gian bootstrap/init.
int tĩnh cuối cùng công khai INFERENCE_PREFERENCE_SUSTAINED_SPEED
Thích tối đa hóa thông lượng. Cùng một đại biểu sẽ được sử dụng nhiều lần trên nhiều đầu vào.
Nhà thầu công cộng
Tùy chọn công khai ()
Phương thức công khai
boolean công khai areQuantizedModelsAllowed ()
công khai int getInferencePreference ()
boolean công khai isPrecisionLossAllowed ()
công khai GpuDelegateFactory.Options setForceBackend ( GpuDelegateFactory.Options.GpuBackend forceBackend)
Đặt Phần cuối GPU.
Thông số
lực lượng phụ trợ |
---|
công khai GpuDelegateFactory.Options setInferencePreference (tùy chọn int)
Đặt tùy chọn suy luận cho sự cân bằng độ chính xác/biên dịch/thời gian chạy.
Thông số
sự ưa thích | Một trong số `INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER` (mặc định), `INFERENCE_PREFERENCE_SUSTAINED_SPEED`. |
---|
công khai GpuDelegateFactory.Options setPrecisionLossAllowed (boolean precisionLossAllowed)
Đặt xem có cho phép mất độ chính xác hay không.
Thông số
độ chính xácMấtCho phép | Khi `true` (mặc định), GPU có thể định lượng tensor, giá trị downcast, xử lý trong FP16. Khi `false`, các phép tính được thực hiện ở dấu phẩy động 32 bit. |
---|
công khai GpuDelegateFactory.Options setQuantizedModelsAllowed (boolean quantizedModelsAllowed)
Cho phép chạy các mô hình lượng tử hóa với đại biểu.
CẢNH BÁO: Đây là API thử nghiệm và có thể thay đổi.
Thông số
mô hình lượng tử hóaĐược phép | Khi true (mặc định), GPU có thể chạy các mô hình lượng tử hóa. |
---|
công khai GpuDelegateFactory.Options setSerializationParams ( String serializationDir, String modelToken)
Cho phép tuần tự hóa trên đại biểu. Lưu ý non-null serializationDir
và modelToken
là bắt buộc để tuần tự hóa.
CẢNH BÁO: Đây là API thử nghiệm và có thể thay đổi.
Thông số
tuần tự hóaDir | Thư mục sử dụng để lưu trữ dữ liệu. Người gọi chịu trách nhiệm đảm bảo mô hình không được lưu trữ trong thư mục chung. Bạn nên sử dụng Context.getCodeCacheDir() để cung cấp vị trí riêng tư cho ứng dụng trên Android. |
---|---|
mô hìnhToken | Mã thông báo được sử dụng để xác định mô hình. Người gọi chịu trách nhiệm đảm bảo mã thông báo là duy nhất cho biểu đồ và dữ liệu mô hình. |