ข้อควรสนใจ: TensorFlow Lite เป็นส่วนหนึ่งของ Google AI Edge แล้ว เอกสารล่าสุดอยู่ในขณะนี้ที่ ai.google.dev/edge/lite เรียนรู้เพิ่มเติม

หน้านี้ได้รับการแปลโดย Cloud Translation API

เริ่มต้นใช้งานไมโครคอนโทรลเลอร์

เอกสารนี้อธิบายวิธีฝึกโมเดลและเรียกใช้การอนุมานโดยใช้ไมโครคอนโทรลเลอร์

ตัวอย่างสวัสดีชาวโลก

ตัวอย่างของ Hello World ได้รับการออกแบบมาเพื่อสาธิตพื้นฐานที่แท้จริงของการใช้ TensorFlow Lite สำหรับไมโครคอนโทรลเลอร์ เราฝึกและรันแบบจำลองที่จำลองฟังก์ชันไซน์ กล่าวคือ ใช้ตัวเลขตัวเดียวเป็นอินพุต และส่งออกค่า ไซน์ ของตัวเลข เมื่อนำไปใช้กับไมโครคอนโทรลเลอร์ การคาดการณ์จะใช้เพื่อกะพริบไฟ LED หรือควบคุมภาพเคลื่อนไหว

เวิร์กโฟลว์ตั้งแต่ต้นทางถึงปลายทางเกี่ยวข้องกับขั้นตอนต่อไปนี้:

ฝึกฝนโมเดล (ใน Python): ไฟล์ Python เพื่อฝึกฝน แปลง และปรับแต่งโมเดลสำหรับการใช้งานบนอุปกรณ์
เรียกใช้การอนุมาน (ใน C++ 17): การทดสอบหน่วยแบบ end-to-end ที่รันการอนุมานในโมเดลโดยใช้ ไลบรารี C++

รับอุปกรณ์ที่รองรับ

แอปพลิเคชันตัวอย่างที่เราจะใช้ได้รับการทดสอบบนอุปกรณ์ต่อไปนี้:

Arduino Nano 33 BLE Sense (ใช้ Arduino IDE)
SparkFun Edge (สร้างโดยตรงจากแหล่งที่มา)
ชุดค้นพบ STM32F746 (ใช้ Mbed)
Adafruit EdgeBadge (ใช้ Arduino IDE)
Adafruit TensorFlow Lite สำหรับชุดไมโครคอนโทรลเลอร์ (โดยใช้ Arduino IDE)
Adafruit Circuit Playground Bluefruit (ใช้ Arduino IDE)
Espressif ESP32-DevKitC (ใช้ ESP IDF)
Espressif ESP-EYE (ใช้ ESP IDF)

เรียนรู้เพิ่มเติมเกี่ยวกับแพลตฟอร์มที่รองรับใน TensorFlow Lite สำหรับไมโครคอนโทรลเลอร์

ฝึกโมเดล

ใช้ train.py สำหรับการฝึกอบรมโมเดล Hello World เพื่อการจดจำคลื่นไซน์

เรียกใช้: bazel build tensorflow/lite/micro/examples/hello_world:train bazel-bin/tensorflow/lite/micro/examples/hello_world/train --save_tf_model --save_dir=/tmp/model_created/

เรียกใช้การอนุมาน

หากต้องการรันโมเดลบนอุปกรณ์ของคุณ เราจะดำเนินการตามคำแนะนำใน README.md :

สวัสดีชาวโลก README.md

ส่วนต่อไปนี้จะอธิบายเกี่ยวกับตัวอย่าง evaluate_test.cc ซึ่งเป็นการทดสอบหน่วย ซึ่งสาธิตวิธีการเรียกใช้การอนุมานโดยใช้ TensorFlow Lite สำหรับไมโครคอนโทรลเลอร์ โดยจะโหลดโมเดลและรันการอนุมานหลายครั้ง

1. รวมส่วนหัวของไลบรารี

หากต้องการใช้ไลบรารี TensorFlow Lite สำหรับไมโครคอนโทรลเลอร์ เราต้องมีไฟล์ส่วนหัวต่อไปนี้:

#include "tensorflow/lite/micro/micro_mutable_op_resolver.h"
#include "tensorflow/lite/micro/micro_error_reporter.h"
#include "tensorflow/lite/micro/micro_interpreter.h"
#include "tensorflow/lite/schema/schema_generated.h"
#include "tensorflow/lite/version.h"

micro_mutable_op_resolver.h จัดเตรียมการดำเนินการที่ล่ามใช้เพื่อรันโมเดล
micro_error_reporter.h ส่งออกข้อมูลการดีบัก
micro_interpreter.h มีโค้ดสำหรับโหลดและรันโมเดล
schema_generated.h มีสคีมาสำหรับรูปแบบไฟล์โมเดล TensorFlow Lite FlatBuffer
version.h ให้ข้อมูลการกำหนดเวอร์ชันสำหรับสคีมา TensorFlow Lite

2. รวมส่วนหัวของโมเดลด้วย

ตัวแปล TensorFlow Lite สำหรับไมโครคอนโทรลเลอร์คาดว่าจะระบุโมเดลเป็นอาร์เรย์ C++ โมเดลถูกกำหนดไว้ในไฟล์ model.h และ model.cc ส่วนหัวจะรวมอยู่ในบรรทัดต่อไปนี้:

#include "tensorflow/lite/micro/examples/hello_world/model.h"

3. รวมส่วนหัวกรอบการทดสอบหน่วย

ในการสร้างการทดสอบหน่วย เราได้รวมเฟรมเวิร์กการทดสอบหน่วย TensorFlow Lite สำหรับไมโครคอนโทรลเลอร์ไว้โดยรวมบรรทัดต่อไปนี้:

#include "tensorflow/lite/micro/testing/micro_test.h"

การทดสอบถูกกำหนดโดยใช้มาโครต่อไปนี้:

TF_LITE_MICRO_TESTS_BEGIN

TF_LITE_MICRO_TEST(LoadModelAndPerformInference) {
  . // add code here
  .
}

TF_LITE_MICRO_TESTS_END

ตอนนี้เราจะพูดถึงโค้ดที่รวมอยู่ในมาโครด้านบน

4. ตั้งค่าการบันทึก

ในการตั้งค่าการบันทึก ตัวชี้ tflite::ErrorReporter จะถูกสร้างขึ้นโดยใช้ตัวชี้ไปยังอินสแตนซ์ tflite::MicroErrorReporter :

tflite::MicroErrorReporter micro_error_reporter;
tflite::ErrorReporter* error_reporter = &micro_error_reporter;

ตัวแปรนี้จะถูกส่งผ่านไปยังล่าม ซึ่งช่วยให้สามารถเขียนบันทึกได้ เนื่องจากไมโครคอนโทรลเลอร์มักจะมีกลไกที่หลากหลายในการบันทึก การใช้งาน tflite::MicroErrorReporter จึงได้รับการออกแบบให้ปรับแต่งให้เหมาะกับอุปกรณ์ของคุณโดยเฉพาะ

5. โหลดโมเดล

ในโค้ดต่อไปนี้ โมเดลจะถูกสร้างอินสแตนซ์โดยใช้ข้อมูลจากอาร์เรย์ char g_model ซึ่งได้รับการประกาศใน model.h จากนั้นเราจะตรวจสอบโมเดลเพื่อให้แน่ใจว่าเวอร์ชันสคีมาเข้ากันได้กับเวอร์ชันที่เราใช้:

const tflite::Model* model = ::tflite::GetModel(g_model);
if (model->version() != TFLITE_SCHEMA_VERSION) {
  TF_LITE_REPORT_ERROR(error_reporter,
      "Model provided is schema version %d not equal "
      "to supported version %d.\n",
      model->version(), TFLITE_SCHEMA_VERSION);
}

6. สร้างอินสแตนซ์ตัวแก้ไขการดำเนินการ

มีการประกาศอินสแตนซ์ MicroMutableOpResolver ล่ามจะใช้สิ่งนี้เพื่อลงทะเบียนและเข้าถึงการดำเนินการที่โมเดลใช้:

using HelloWorldOpResolver = tflite::MicroMutableOpResolver<1>;

TfLiteStatus RegisterOps(HelloWorldOpResolver& op_resolver) {
  TF_LITE_ENSURE_STATUS(op_resolver.AddFullyConnected());
  return kTfLiteOk;

MicroMutableOpResolver ต้องใช้พารามิเตอร์เทมเพลตที่ระบุจำนวน ops ที่จะลงทะเบียน ฟังก์ชัน RegisterOps จะลงทะเบียนการดำเนินการกับตัวแก้ไข

HelloWorldOpResolver op_resolver;
TF_LITE_ENSURE_STATUS(RegisterOps(op_resolver));

7. จัดสรรหน่วยความจำ

เราจำเป็นต้องจัดสรรหน่วยความจำจำนวนหนึ่งล่วงหน้าสำหรับอินพุต เอาต์พุต และอาร์เรย์ระดับกลาง สิ่งนี้มีให้เป็นอาร์เรย์ uint8_t ขนาด tensor_arena_size :

const int tensor_arena_size = 2 * 1024;
uint8_t tensor_arena[tensor_arena_size];

ขนาดที่ต้องการจะขึ้นอยู่กับรุ่นที่คุณใช้ และอาจต้องพิจารณาจากการทดลอง

8. สร้างอินสแตนซ์ล่าม

เราสร้างอินสแตนซ์ tflite::MicroInterpreter โดยส่งผ่านตัวแปรที่สร้างไว้ก่อนหน้านี้:

tflite::MicroInterpreter interpreter(model, resolver, tensor_arena,
                                     tensor_arena_size, error_reporter);

9. จัดสรรเทนเซอร์

เราบอกให้ล่ามจัดสรรหน่วยความจำจาก tensor_arena สำหรับเทนเซอร์ของโมเดล:

interpreter.AllocateTensors();

10. ตรวจสอบรูปร่างอินพุต

อินสแตนซ์ MicroInterpreter สามารถให้ตัวชี้แก่เราไปยังอินพุตเทนเซอร์ของโมเดลได้โดยการเรียก .input(0) โดยที่ 0 แสดงถึงเทนเซอร์อินพุตตัวแรก (และเท่านั้น):

  // Obtain a pointer to the model's input tensor
  TfLiteTensor* input = interpreter.input(0);

จากนั้นเราจะตรวจสอบเทนเซอร์นี้เพื่อยืนยันว่ารูปร่างและประเภทของเซ็นเซอร์เป็นไปตามที่เราคาดหวัง:

// Make sure the input has the properties we expect
TF_LITE_MICRO_EXPECT_NE(nullptr, input);
// The property "dims" tells us the tensor's shape. It has one element for
// each dimension. Our input is a 2D tensor containing 1 element, so "dims"
// should have size 2.
TF_LITE_MICRO_EXPECT_EQ(2, input->dims->size);
// The value of each element gives the length of the corresponding tensor.
// We should expect two single element tensors (one is contained within the
// other).
TF_LITE_MICRO_EXPECT_EQ(1, input->dims->data[0]);
TF_LITE_MICRO_EXPECT_EQ(1, input->dims->data[1]);
// The input is a 32 bit floating point value
TF_LITE_MICRO_EXPECT_EQ(kTfLiteFloat32, input->type);

ค่าแจงนับ kTfLiteFloat32 เป็นการอ้างอิงถึงประเภทข้อมูล TensorFlow Lite ประเภทใดประเภทหนึ่ง และกำหนดไว้ใน common.h

11. ระบุค่าอินพุต

เพื่อจัดเตรียมอินพุตให้กับโมเดล เราได้ตั้งค่าเนื้อหาของเทนเซอร์อินพุตดังนี้:

input->data.f[0] = 0.;

ในกรณีนี้ เราป้อนค่าจุดลอยตัวที่แสดงถึง 0

12. รันโมเดล

ในการรันโมเดล เราสามารถเรียก Invoke() บนอินสแตนซ์ tflite::MicroInterpreter ของเราได้:

TfLiteStatus invoke_status = interpreter.Invoke();
if (invoke_status != kTfLiteOk) {
  TF_LITE_REPORT_ERROR(error_reporter, "Invoke failed\n");
}

เราสามารถตรวจสอบค่าที่ส่งคืนเป็น TfLiteStatus เพื่อตรวจสอบว่าการรันสำเร็จหรือไม่ ค่าที่เป็นไปได้ของ TfLiteStatus ที่กำหนดใน common.h คือ kTfLiteOk และ kTfLiteError

รหัสต่อไปนี้ยืนยันว่าค่าคือ kTfLiteOk หมายความว่าการอนุมานถูกรันสำเร็จ

TF_LITE_MICRO_EXPECT_EQ(kTfLiteOk, invoke_status);

13. รับผลลัพธ์

สามารถรับเอาท์พุตเทนเซอร์ของโมเดลได้โดยการเรียก output(0) บน tflite::MicroInterpreter โดยที่ 0 แสดงถึงเทนเซอร์เอาท์พุตตัวแรก (และเท่านั้น)

ในตัวอย่าง ผลลัพธ์ของโมเดลคือค่าจุดลอยตัวเดียวที่อยู่ภายในเมตริกซ์ 2 มิติ:

TfLiteTensor* output = interpreter.output(0);
TF_LITE_MICRO_EXPECT_EQ(2, output->dims->size);
TF_LITE_MICRO_EXPECT_EQ(1, input->dims->data[0]);
TF_LITE_MICRO_EXPECT_EQ(1, input->dims->data[1]);
TF_LITE_MICRO_EXPECT_EQ(kTfLiteFloat32, output->type);

เราสามารถอ่านค่าได้โดยตรงจากเอาท์พุตเทนเซอร์และยืนยันว่าเป็นสิ่งที่เราคาดหวัง:

// Obtain the output value from the tensor
float value = output->data.f[0];
// Check that the output value is within 0.05 of the expected value
TF_LITE_MICRO_EXPECT_NEAR(0., value, 0.05);

14. เรียกใช้การอนุมานอีกครั้ง

ส่วนที่เหลือของโค้ดจะเรียกใช้การอนุมานอีกหลายครั้ง ในแต่ละกรณี เรากำหนดค่าให้กับเทนเซอร์อินพุต เรียกใช้ล่าม และอ่านผลลัพธ์จากเทนเซอร์เอาท์พุต:

input->data.f[0] = 1.;
interpreter.Invoke();
value = output->data.f[0];
TF_LITE_MICRO_EXPECT_NEAR(0.841, value, 0.05);

input->data.f[0] = 3.;
interpreter.Invoke();
value = output->data.f[0];
TF_LITE_MICRO_EXPECT_NEAR(0.141, value, 0.05);

input->data.f[0] = 5.;
interpreter.Invoke();
value = output->data.f[0];
TF_LITE_MICRO_EXPECT_NEAR(-0.959, value, 0.05);