Este documento explica como usar o TensorFlow Lite Hexagon Delegate em seu aplicativo usando a API Java e/ou C. O delegado aproveita a biblioteca Qualcomm Hexagon para executar kernels quantizados no DSP. Observe que o delegado destina-se a complementar a funcionalidade NNAPI, especialmente para dispositivos em que a aceleração NNAPI DSP não está disponível (por exemplo, em dispositivos mais antigos ou dispositivos que ainda não têm um driver DSP NNAPI).
Dispositivos suportados:
Atualmente, a seguinte arquitetura Hexagon é suportada, incluindo, mas não se limitando a:
- Hexágono 680
- Exemplos de SoC: Snapdragon 821, 820, 660
- Hexágono 682
- Exemplos de SoC: Snapdragon 835
- Hexágono 685
- Exemplos de SoC: Snapdragon 845, Snapdragon 710, QCS410, QCS610, QCS605, QCS603
- Hexágono 690
- Exemplos de SoC: Snapdragon 855, RB5
Modelos suportados:
O delegado Hexagon suporta todos os modelos que estão em conformidade com nossa especificação de quantização simétrica de 8 bits , incluindo aqueles gerados usando quantização inteira pós-treinamento . Os modelos UInt8 treinados com o caminho de treinamento com reconhecimento de quantização legado também são suportados, por exemplo, essas versões quantizadas em nossa página de modelos hospedados.
API Java de delegado hexágono
public class HexagonDelegate implements Delegate, Closeable {
/*
* Creates a new HexagonDelegate object given the current 'context'.
* Throws UnsupportedOperationException if Hexagon DSP delegation is not
* available on this device.
*/
public HexagonDelegate(Context context) throws UnsupportedOperationException
/**
* Frees TFLite resources in C runtime.
*
* User is expected to call this method explicitly.
*/
@Override
public void close();
}
Exemplo de uso
Etapa 1. Edite app/build.gradle para usar o AAR de delegado Hexagon noturno
dependencies {
...
implementation 'org.tensorflow:tensorflow-lite:0.0.0-nightly-SNAPSHOT'
implementation 'org.tensorflow:tensorflow-lite-hexagon:0.0.0-nightly-SNAPSHOT'
}
Etapa 2. Adicione bibliotecas Hexagon ao seu aplicativo Android
- Baixe e execute hexagon_nn_skel.run. Deve fornecer 3 bibliotecas compartilhadas diferentes “libhexagon_nn_skel.so”, “libhexagon_nn_skel_v65.so”, “libhexagon_nn_skel_v66.so”
- Inclua todos os 3 em seu aplicativo com outras bibliotecas compartilhadas. Consulte Como adicionar biblioteca compartilhada ao seu aplicativo . O delegado escolherá automaticamente aquele com melhor desempenho, dependendo do dispositivo.
Etapa 3. Criar um delegado e inicializar um intérprete do TensorFlow Lite
import org.tensorflow.lite.HexagonDelegate;
// Create the Delegate instance.
try {
hexagonDelegate = new HexagonDelegate(activity);
tfliteOptions.addDelegate(hexagonDelegate);
} catch (UnsupportedOperationException e) {
// Hexagon delegate is not supported on this device.
}
tfliteInterpreter = new Interpreter(tfliteModel, tfliteOptions);
// Dispose after finished with inference.
tfliteInterpreter.close();
if (hexagonDelegate != null) {
hexagonDelegate.close();
}
API C de delegado hexágono
struct TfLiteHexagonDelegateOptions {
// This corresponds to the debug level in the Hexagon SDK. 0 (default)
// means no debug.
int debug_level;
// This corresponds to powersave_level in the Hexagon SDK.
// where 0 (default) means high performance which means more power
// consumption.
int powersave_level;
// If set to true, performance information about the graph will be dumped
// to Standard output, this includes cpu cycles.
// WARNING: Experimental and subject to change anytime.
bool print_graph_profile;
// If set to true, graph structure will be dumped to Standard output.
// This is usually beneficial to see what actual nodes executed on
// the DSP. Combining with 'debug_level' more information will be printed.
// WARNING: Experimental and subject to change anytime.
bool print_graph_debug;
};
// Return a delegate that uses Hexagon SDK for ops execution.
// Must outlive the interpreter.
TfLiteDelegate*
TfLiteHexagonDelegateCreate(const TfLiteHexagonDelegateOptions* options);
// Do any needed cleanup and delete 'delegate'.
void TfLiteHexagonDelegateDelete(TfLiteDelegate* delegate);
// Initializes the DSP connection.
// This should be called before doing any usage of the delegate.
// "lib_directory_path": Path to the directory which holds the
// shared libraries for the Hexagon NN libraries on the device.
void TfLiteHexagonInitWithPath(const char* lib_directory_path);
// Same as above method but doesn't accept the path params.
// Assumes the environment setup is already done. Only initialize Hexagon.
Void TfLiteHexagonInit();
// Clean up and switch off the DSP connection.
// This should be called after all processing is done and delegate is deleted.
Void TfLiteHexagonTearDown();
Exemplo de uso
Etapa 1. Edite app/build.gradle para usar o AAR de delegado Hexagon noturno
dependencies {
...
implementation 'org.tensorflow:tensorflow-lite:0.0.0-nightly-SNAPSHOT'
implementation 'org.tensorflow:tensorflow-lite-hexagon:0.0.0-nightly-SNAPSHOT'
}
Etapa 2. Adicione bibliotecas Hexagon ao seu aplicativo Android
- Baixe e execute hexagon_nn_skel.run. Deve fornecer 3 bibliotecas compartilhadas diferentes “libhexagon_nn_skel.so”, “libhexagon_nn_skel_v65.so”, “libhexagon_nn_skel_v66.so”
- Inclua todos os 3 em seu aplicativo com outras bibliotecas compartilhadas. Consulte Como adicionar biblioteca compartilhada ao seu aplicativo . O delegado escolherá automaticamente aquele com melhor desempenho, dependendo do dispositivo.
Etapa 3. Inclua o cabeçalho C
- O arquivo de cabeçalho "hexagon_delegate.h" pode ser baixado do GitHub ou extraído do AAR delegado do Hexagon.
Etapa 4. Criar um delegado e inicializar um intérprete do TensorFlow Lite
Em seu código, certifique-se de que a biblioteca Hexagon nativa esteja carregada. Isso pode ser feito chamando
System.loadLibrary("tensorflowlite_hexagon_jni");
em sua Activity ou ponto de entrada Java.Crie um delegado, exemplo:
#include "tensorflow/lite/delegates/hexagon/hexagon_delegate.h"
// Assuming shared libraries are under "/data/local/tmp/"
// If files are packaged with native lib in android App then it
// will typically be equivalent to the path provided by
// "getContext().getApplicationInfo().nativeLibraryDir"
const char[] library_directory_path = "/data/local/tmp/";
TfLiteHexagonInitWithPath(library_directory_path); // Needed once at startup.
::tflite::TfLiteHexagonDelegateOptions params = {0};
// 'delegate_ptr' Need to outlive the interpreter. For example,
// If use case will need to resize input or anything that can trigger
// re-applying delegates then 'delegate_ptr' need to outlive the interpreter.
auto* delegate_ptr = ::tflite::TfLiteHexagonDelegateCreate(¶ms);
Interpreter::TfLiteDelegatePtr delegate(delegate_ptr,
[](TfLiteDelegate* delegate) {
::tflite::TfLiteHexagonDelegateDelete(delegate);
});
interpreter->ModifyGraphWithDelegate(delegate.get());
// After usage of delegate.
TfLiteHexagonTearDown(); // Needed once at end of app/DSP usage.
Adicionar a biblioteca compartilhada ao seu aplicativo
- Crie a pasta “app/src/main/jniLibs” e crie um diretório para cada arquitetura de destino. Por exemplo,
- ARM de 64 bits:
app/src/main/jniLibs/arm64-v8a
- ARM de 32 bits:
app/src/main/jniLibs/armeabi-v7a
- ARM de 64 bits:
- Coloque seu .so no diretório que corresponde à arquitetura.
Comentários
Para problemas, crie um problema no GitHub com todos os detalhes de reprodução necessários, incluindo o modelo do telefone e a placa usada ( adb shell getprop ro.product.device
e adb shell getprop ro.board.platform
).
Perguntas frequentes
- Quais operações são apoiadas pelo delegado?
- Veja a lista atual de operações e restrições compatíveis
- Como posso saber que o modelo está usando o DSP quando habilito o delegado?
- Duas mensagens de log serão impressas quando você habilitar o delegado - uma para indicar se o delegado foi criado e outra para indicar quantos nós estão sendo executados usando o delegado.
Created TensorFlow Lite delegate for Hexagon.
Hexagon delegate: X nodes delegated out of Y nodes.
- Duas mensagens de log serão impressas quando você habilitar o delegado - uma para indicar se o delegado foi criado e outra para indicar quantos nós estão sendo executados usando o delegado.
- Preciso que todas as operações no modelo tenham suporte para executar o delegado?
- Não, o Modelo será dividido em subgráficos com base nas operações suportadas. Quaisquer operações não suportadas serão executadas na CPU.
- Como posso construir o AAR delegado do Hexagon a partir da fonte?
- Use
bazel build -c opt --config=android_arm64 tensorflow/lite/delegates/hexagon/java:tensorflow-lite-hexagon
.
- Use
- Por que o delegado do Hexagon não inicializa, embora meu dispositivo Android tenha um SoC compatível?
- Verifique se o seu dispositivo realmente tem um SoC compatível. Execute
adb shell cat /proc/cpuinfo | grep Hardware
e veja se ele retorna algo como "Hardware: Qualcomm Technologies, Inc MSMXXXX". - Alguns fabricantes de telefones usam SoCs diferentes para o mesmo modelo de telefone. Portanto, o delegado Hexagon pode funcionar apenas em alguns, mas não em todos os dispositivos do mesmo modelo de telefone.
- Alguns fabricantes de telefones restringem intencionalmente o uso do Hexagon DSP de aplicativos Android que não são do sistema, tornando o delegado do Hexagon incapaz de trabalhar.
- Verifique se o seu dispositivo realmente tem um SoC compatível. Execute
- Meu telefone bloqueou o acesso DSP. Eu fiz root no telefone e ainda não consigo executar o delegado, o que fazer?
- Certifique-se de desabilitar a imposição do SELinux executando
adb shell setenforce 0
- Certifique-se de desabilitar a imposição do SELinux executando