Attenzione: TensorFlow Lite ora fa parte di Google AI Edge. La documentazione più recente è ora su ai.google.dev/edge/lite . Saperne di più

Questa pagina è stata tradotta dall'API Cloud Translation.

Compilazione incrociata TensorFlow Lite con CMake

Questa pagina descrive come creare la libreria TensorFlow Lite per vari dispositivi ARM.

Le seguenti istruzioni sono state testate su Ubuntu 16.04.3 PC a 64 bit (AMD64), TensorFlow devel docker image tensorflow/tensorflow:devel .

Prerequisiti

È necessario che CMake sia installato e scaricato il codice sorgente TensorFlow. Per i dettagli, consulta la pagina Costruisci TensorFlow Lite con CMake .

Controlla l'ambiente di destinazione

I seguenti esempi sono testati con il sistema operativo Raspberry Pi, Ubuntu Server 20.04 LTS e Mendel Linux 4.0. A seconda della versione glibc di destinazione e delle capacità della CPU, potrebbe essere necessario utilizzare versioni diverse della toolchain e dei parametri di build.

Controllo della versione di glibc

ldd --version

ldd (Debian GLIBC 2.28-10) 2.28
Copyright (C) 2018 Free Software Foundation, Inc.
This is free software; see the source for copying conditions.  There is NO
warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
Written by Roland McGrath and Ulrich Drepper.

Verifica compatibilità ABI

Se la destinazione è ARM a 32 bit, sono disponibili due ABI a seconda della disponibilità VFP. armhf e armel . Questo documento mostra un esempio di armhf, è necessario utilizzare una toolchain diversa per i target armel.

Verifica della capacità della CPU

Per ARMv7, dovresti conoscere la versione VFP supportata dal target e la disponibilità NEON.

cat /proc/cpuinfo

processor   : 0
model name  : ARMv7 Processor rev 3 (v7l)
BogoMIPS    : 108.00
Features    : half thumb fastmult vfp edsp neon vfpv3 tls vfpv4 idiva idivt vfpd32 lpae evtstrm crc32
CPU implementer : 0x41
CPU architecture: 7
CPU variant : 0x0
CPU part    : 0xd08
CPU revision    : 3

Crea per AArch64 (ARM64)

Queste istruzioni mostrano come creare il binario AArch64 compatibile con Coral Mendel Linux 4.0 , Raspberry Pi (con Ubuntu Server 20.04.01 LTS a 64 bit installato).

Scarica la catena di strumenti

Questi comandi installano la toolchain gcc-arm-8.3-2019.03-x86_64-aarch64-linux-gnu in ${HOME}/toolchains.

curl -LO https://storage.googleapis.com/mirror.tensorflow.org/developer.arm.com/media/Files/downloads/gnu-a/8.3-2019.03/binrel/gcc-arm-8.3-2019.03-x86_64-aarch64-linux-gnu.tar.xz
mkdir -p ${HOME}/toolchains
tar xvf gcc-arm-8.3-2019.03-x86_64-aarch64-linux-gnu.tar.xz -C ${HOME}/toolchains

Esegui CMake

ARMCC_PREFIX=${HOME}/toolchains/gcc-arm-8.3-2019.03-x86_64-aarch64-linux-gnu/bin/aarch64-linux-gnu-
ARMCC_FLAGS="-funsafe-math-optimizations"
cmake -DCMAKE_C_COMPILER=${ARMCC_PREFIX}gcc \
  -DCMAKE_CXX_COMPILER=${ARMCC_PREFIX}g++ \
  -DCMAKE_C_FLAGS="${ARMCC_FLAGS}" \
  -DCMAKE_CXX_FLAGS="${ARMCC_FLAGS}" \
  -DCMAKE_VERBOSE_MAKEFILE:BOOL=ON \
  -DCMAKE_SYSTEM_NAME=Linux \
  -DCMAKE_SYSTEM_PROCESSOR=aarch64 \
  ../tensorflow/lite/

Build per ARMv7 NEON abilitato

Queste istruzioni mostrano come creare ARMv7 con VFPv4 e binario abilitato NEON compatibile con Raspberry Pi 3 e 4.

Scarica la catena di strumenti

Questi comandi installano la toolchain gcc-arm-8.3-2019.03-x86_64-arm-linux-gnueabihf in ${HOME}/toolchains.

curl -LO https://storage.googleapis.com/mirror.tensorflow.org/developer.arm.com/media/Files/downloads/gnu-a/8.3-2019.03/binrel/gcc-arm-8.3-2019.03-x86_64-arm-linux-gnueabihf.tar.xz
mkdir -p ${HOME}/toolchains
tar xvf gcc-arm-8.3-2019.03-x86_64-arm-linux-gnueabihf.tar.xz -C ${HOME}/toolchains

Esegui CMake

ARMCC_FLAGS="-march=armv7-a -mfpu=neon-vfpv4 -funsafe-math-optimizations -mfp16-format=ieee"
ARMCC_PREFIX=${HOME}/toolchains/gcc-arm-8.3-2019.03-x86_64-arm-linux-gnueabihf/bin/arm-linux-gnueabihf-
cmake -DCMAKE_C_COMPILER=${ARMCC_PREFIX}gcc \
  -DCMAKE_CXX_COMPILER=${ARMCC_PREFIX}g++ \
  -DCMAKE_C_FLAGS="${ARMCC_FLAGS}" \
  -DCMAKE_CXX_FLAGS="${ARMCC_FLAGS}" \
  -DCMAKE_VERBOSE_MAKEFILE:BOOL=ON \
  -DCMAKE_SYSTEM_NAME=Linux \
  -DCMAKE_SYSTEM_PROCESSOR=armv7 \
  ../tensorflow/lite/

Costruisci per Raspberry Pi Zero (ARMv6)

Questa istruzione mostra come creare il binario ARMv6 compatibile con Raspberry Pi Zero.

Scarica la catena di strumenti

Questi comandi installano la toolchain gcc-arm-8.3-2019.03-x86_64-arm-linux-gnueabihf in ${HOME}/toolchains.

curl -LO https://storage.googleapis.com/mirror.tensorflow.org/developer.arm.com/media/Files/downloads/gnu-a/8.3-2019.03/binrel/gcc-arm-8.3-2019.03-x86_64-arm-linux-gnueabihf.tar.xz
mkdir -p ${HOME}/toolchains
tar xvf gcc-arm-8.3-2019.03-x86_64-arm-linux-gnueabihf.tar.xz -C ${HOME}/toolchains

Esegui CMake

ARMCC_FLAGS="-march=armv6 -mfpu=vfp -mfloat-abi=hard -funsafe-math-optimizations"
ARMCC_PREFIX=${HOME}/toolchains/gcc-arm-8.3-2019.03-x86_64-arm-linux-gnueabihf/bin/arm-linux-gnueabihf-
cmake -DCMAKE_C_COMPILER=${ARMCC_PREFIX}gcc \
  -DCMAKE_CXX_COMPILER=${ARMCC_PREFIX}g++ \
  -DCMAKE_C_FLAGS="${ARMCC_FLAGS}" \
  -DCMAKE_CXX_FLAGS="${ARMCC_FLAGS}" \
  -DCMAKE_VERBOSE_MAKEFILE:BOOL=ON \
  -DCMAKE_SYSTEM_NAME=Linux \
  -DCMAKE_SYSTEM_PROCESSOR=armv6 \
  -DTFLITE_ENABLE_XNNPACK=OFF \
  ../tensorflow/lite/