Esta página foi traduzida pela API Cloud Translation.

Comece com microcontroladores

Este documento explica como treinar um modelo e executar inferência usando um microcontrolador.

O exemplo Olá Mundo

O exemplo Hello World foi projetado para demonstrar os fundamentos absolutos do uso do TensorFlow Lite para microcontroladores. Treinamos e executamos um modelo que replica uma função seno, ou seja, recebe um único número como entrada e gera o valor seno do número. Quando implantado no microcontrolador, suas previsões são usadas para piscar LEDs ou controlar uma animação.

O fluxo de trabalho ponta a ponta envolve as seguintes etapas:

Treinar um modelo (em Python): um arquivo python para treinar, converter e otimizar um modelo para uso no dispositivo.
Executar inferência (em C++ 17): um teste de unidade ponta a ponta que executa inferência no modelo usando a biblioteca C++ .

Obtenha um dispositivo compatível

O aplicativo de exemplo que usaremos foi testado nos seguintes dispositivos:

Arduino Nano 33 BLE Sense (usando Arduino IDE)
SparkFun Edge (construído diretamente da fonte)
Kit Discovery STM32F746 (usando Mbed)
Adafruit EdgeBadge (usando Arduino IDE)
Kit Adafruit TensorFlow Lite para microcontroladores (usando Arduino IDE)
Circuito Adafruit Playground Bluefruit (usando Arduino IDE)
Espressif ESP32-DevKitC (usando ESP IDF)
Espressif ESP-EYE (usando ESP IDF)

Saiba mais sobre as plataformas compatíveis no TensorFlow Lite para microcontroladores .

Treine um modelo

Use train.py para treinamento de modelo hello world para reconhecimento sinwave

Execute: bazel build tensorflow/lite/micro/examples/hello_world:train bazel-bin/tensorflow/lite/micro/examples/hello_world/train --save_tf_model --save_dir=/tmp/model_created/

Executar inferência

Para executar o modelo em seu dispositivo, seguiremos as instruções no README.md :

Olá mundo README.md

As seções a seguir abordam evaluate_test.cc do exemplo, teste de unidade que demonstra como executar inferência usando o TensorFlow Lite para microcontroladores. Ele carrega o modelo e executa a inferência várias vezes.

1. Incluir os cabeçalhos da biblioteca

Para usar a biblioteca TensorFlow Lite for Microcontrollers, devemos incluir os seguintes arquivos de cabeçalho:

#include "tensorflow/lite/micro/micro_mutable_op_resolver.h"
#include "tensorflow/lite/micro/micro_error_reporter.h"
#include "tensorflow/lite/micro/micro_interpreter.h"
#include "tensorflow/lite/schema/schema_generated.h"
#include "tensorflow/lite/version.h"

micro_mutable_op_resolver.h fornece as operações usadas pelo interpretador para executar o modelo.
micro_error_reporter.h gera informações de depuração.
micro_interpreter.h contém código para carregar e executar modelos.
schema_generated.h contém o esquema para o formato de arquivo de modelo TensorFlow Lite FlatBuffer .
version.h fornece informações de controle de versão para o esquema do TensorFlow Lite.

2. Incluir o cabeçalho do modelo

O interpretador TensorFlow Lite for Microcontrollers espera que o modelo seja fornecido como uma matriz C++. O modelo é definido nos arquivos model.h e model.cc . O cabeçalho está incluído na seguinte linha:

#include "tensorflow/lite/micro/examples/hello_world/model.h"

3. Incluir o cabeçalho da estrutura de teste de unidade

Para criar um teste de unidade, incluímos a estrutura de teste de unidade TensorFlow Lite for Microcontrollers incluindo a seguinte linha:

#include "tensorflow/lite/micro/testing/micro_test.h"

O teste é definido usando as seguintes macros:

TF_LITE_MICRO_TESTS_BEGIN

TF_LITE_MICRO_TEST(LoadModelAndPerformInference) {
  . // add code here
  .
}

TF_LITE_MICRO_TESTS_END

Discutiremos agora o código incluído na macro acima.

4. Configure o registro

Para configurar o log, um ponteiro tflite::ErrorReporter é criado usando um ponteiro para uma instância tflite::MicroErrorReporter :

tflite::MicroErrorReporter micro_error_reporter;
tflite::ErrorReporter* error_reporter = &micro_error_reporter;

Esta variável será passada para o interpretador, que permite gravar logs. Como os microcontroladores geralmente possuem uma variedade de mecanismos de registro, a implementação de tflite::MicroErrorReporter foi projetada para ser personalizada para seu dispositivo específico.

5. Carregue um modelo

No código a seguir, o modelo é instanciado usando dados de um array char , g_model , que é declarado em model.h . Em seguida, verificamos o modelo para garantir que sua versão do esquema seja compatível com a versão que estamos usando:

const tflite::Model* model = ::tflite::GetModel(g_model);
if (model->version() != TFLITE_SCHEMA_VERSION) {
  TF_LITE_REPORT_ERROR(error_reporter,
      "Model provided is schema version %d not equal "
      "to supported version %d.\n",
      model->version(), TFLITE_SCHEMA_VERSION);
}

6. Instanciar o resolvedor de operações

Uma instância MicroMutableOpResolver é declarada. Isso será utilizado pelo intérprete para registrar e acessar as operações que são utilizadas pelo modelo:

using HelloWorldOpResolver = tflite::MicroMutableOpResolver<1>;

TfLiteStatus RegisterOps(HelloWorldOpResolver& op_resolver) {
  TF_LITE_ENSURE_STATUS(op_resolver.AddFullyConnected());
  return kTfLiteOk;

O MicroMutableOpResolver requer um parâmetro de modelo indicando o número de operações que serão registradas. A função RegisterOps registra as operações com o resolvedor.

HelloWorldOpResolver op_resolver;
TF_LITE_ENSURE_STATUS(RegisterOps(op_resolver));

7. Alocar memória

Precisamos pré-alocar uma certa quantidade de memória para matrizes de entrada, saída e intermediárias. Isso é fornecido como uma matriz uint8_t de tamanho tensor_arena_size :

const int tensor_arena_size = 2 * 1024;
uint8_t tensor_arena[tensor_arena_size];

O tamanho necessário dependerá do modelo que você está usando e pode precisar ser determinado por meio de experimentação.

8. Instanciar intérprete

Criamos uma instância tflite::MicroInterpreter , passando as variáveis criadas anteriormente:

tflite::MicroInterpreter interpreter(model, resolver, tensor_arena,
                                     tensor_arena_size, error_reporter);

9. Aloque tensores

Dizemos ao intérprete para alocar memória do tensor_arena para os tensores do modelo:

interpreter.AllocateTensors();

10. Valide o formato de entrada

A instância MicroInterpreter pode nos fornecer um ponteiro para o tensor de entrada do modelo chamando .input(0) , onde 0 representa o primeiro (e único) tensor de entrada:

  // Obtain a pointer to the model's input tensor
  TfLiteTensor* input = interpreter.input(0);

Em seguida, inspecionamos esse tensor para confirmar se sua forma e tipo são os que esperamos:

// Make sure the input has the properties we expect
TF_LITE_MICRO_EXPECT_NE(nullptr, input);
// The property "dims" tells us the tensor's shape. It has one element for
// each dimension. Our input is a 2D tensor containing 1 element, so "dims"
// should have size 2.
TF_LITE_MICRO_EXPECT_EQ(2, input->dims->size);
// The value of each element gives the length of the corresponding tensor.
// We should expect two single element tensors (one is contained within the
// other).
TF_LITE_MICRO_EXPECT_EQ(1, input->dims->data[0]);
TF_LITE_MICRO_EXPECT_EQ(1, input->dims->data[1]);
// The input is a 32 bit floating point value
TF_LITE_MICRO_EXPECT_EQ(kTfLiteFloat32, input->type);

O valor enum kTfLiteFloat32 é uma referência a um dos tipos de dados do TensorFlow Lite e é definido em common.h .

11. Forneça um valor de entrada

Para fornecer uma entrada ao modelo, definimos o conteúdo do tensor de entrada, como segue:

input->data.f[0] = 0.;

Neste caso, inserimos um valor de ponto flutuante representando 0 .

12. Execute o modelo

Para executar o modelo, podemos chamar Invoke() em nossa instância tflite::MicroInterpreter :

TfLiteStatus invoke_status = interpreter.Invoke();
if (invoke_status != kTfLiteOk) {
  TF_LITE_REPORT_ERROR(error_reporter, "Invoke failed\n");
}

Podemos verificar o valor de retorno, um TfLiteStatus , para determinar se a execução foi bem-sucedida. Os valores possíveis de TfLiteStatus , definidos em common.h , são kTfLiteOk e kTfLiteError .

O código a seguir afirma que o valor é kTfLiteOk , o que significa que a inferência foi executada com êxito.

TF_LITE_MICRO_EXPECT_EQ(kTfLiteOk, invoke_status);

13. Obtenha o resultado

O tensor de saída do modelo pode ser obtido chamando output(0) no tflite::MicroInterpreter , onde 0 representa o primeiro (e único) tensor de saída.

No exemplo, a saída do modelo é um único valor de ponto flutuante contido em um tensor 2D:

TfLiteTensor* output = interpreter.output(0);
TF_LITE_MICRO_EXPECT_EQ(2, output->dims->size);
TF_LITE_MICRO_EXPECT_EQ(1, input->dims->data[0]);
TF_LITE_MICRO_EXPECT_EQ(1, input->dims->data[1]);
TF_LITE_MICRO_EXPECT_EQ(kTfLiteFloat32, output->type);

Podemos ler o valor diretamente do tensor de saída e afirmar que é o que esperamos:

// Obtain the output value from the tensor
float value = output->data.f[0];
// Check that the output value is within 0.05 of the expected value
TF_LITE_MICRO_EXPECT_NEAR(0., value, 0.05);

14. Execute a inferência novamente

O restante do código executa a inferência várias vezes. Em cada instância, atribuímos um valor ao tensor de entrada, invocamos o interpretador e lemos o resultado do tensor de saída:

input->data.f[0] = 1.;
interpreter.Invoke();
value = output->data.f[0];
TF_LITE_MICRO_EXPECT_NEAR(0.841, value, 0.05);

input->data.f[0] = 3.;
interpreter.Invoke();
value = output->data.f[0];
TF_LITE_MICRO_EXPECT_NEAR(0.141, value, 0.05);

input->data.f[0] = 5.;
interpreter.Invoke();
value = output->data.f[0];
TF_LITE_MICRO_EXPECT_NEAR(-0.959, value, 0.05);