Atención: TensorFlow Lite ahora es parte de Google AI Edge. La documentación más reciente se encuentra ahora en ai.google.dev/edge/lite . Aprende más

Esta página se ha traducido con Cloud Translation API.

InterpreterApi

interfaz pública InterpreterApi

Subclases indirectas conocidas

Intérprete

Interfaz para el intérprete de modelos TensorFlow Lite, excluyendo métodos experimentales.

Una instancia InterpreterApi encapsula un modelo de TensorFlow Lite previamente entrenado, en el que se ejecutan operaciones para la inferencia del modelo.

Por ejemplo, si un modelo toma solo una entrada y devuelve solo una salida:

try (InterpreterApi interpreter =
     new InterpreterApi.create(file_of_a_tensorflowlite_model)) {
   interpreter.run(input, output);
 }

Si un modelo toma múltiples entradas o salidas:

Object[] inputs = {input0, input1, ...};
 Map&lt;Integer, Object&gt; map_of_indices_to_outputs = new HashMap&lt;&gt;();
 FloatBuffer ith_output = FloatBuffer.allocateDirect(3 * 2 * 4);  // Float tensor, shape 3x2x4.
 ith_output.order(ByteOrder.nativeOrder());
 map_of_indices_to_outputs.put(i, ith_output);
 try (InterpreterApi interpreter =
     new InterpreterApi.create(file_of_a_tensorflowlite_model)) {
   interpreter.runForMultipleInputsOutputs(inputs, map_of_indices_to_outputs);
 }

Si un modelo toma o produce tensores de cuerdas:

String[] input = {"foo", "bar"};  // Input tensor shape is [2].
 String[][] output = new String[3][2];  // Output tensor shape is [3, 2].
 try (InterpreterApi interpreter =
     new InterpreterApi.create(file_of_a_tensorflowlite_model)) {
   interpreter.runForMultipleInputsOutputs(input, output);
 }

Tenga en cuenta que existe una distinción entre forma [] y forma [1]. Para salidas de tensor de cadena escalar:

String[] input = {"foo"};  // Input tensor shape is [1].
 ByteBuffer outputBuffer = ByteBuffer.allocate(OUTPUT_BYTES_SIZE);  // Output tensor shape is [].
 try (Interpreter interpreter = new Interpreter(file_of_a_tensorflowlite_model)) {
   interpreter.runForMultipleInputsOutputs(input, outputBuffer);
 }
 byte[] outputBytes = new byte[outputBuffer.remaining()];
 outputBuffer.get(outputBytes);
 // Below, the `charset` can be StandardCharsets.UTF_8.
 String output = new String(outputBytes, charset);

Los órdenes de entradas y salidas se determinan al convertir el modelo TensorFlow al modelo TensorFlowLite con Toco, al igual que las formas predeterminadas de las entradas.

Cuando las entradas se proporcionan como matrices (multidimensionales), los tensores de entrada correspondientes cambiarán de tamaño implícitamente de acuerdo con la forma de esa matriz. Cuando las entradas se proporcionan como tipos Buffer , no se realiza ningún cambio de tamaño implícito; la persona que llama debe asegurarse de que el tamaño de bytes Buffer coincida con el del tensor correspondiente o que primero cambie el tamaño del tensor mediante resizeInput(int, int[]) . La información sobre la forma y el tipo de tensor se puede obtener a través de la clase Tensor , disponible a través de getInputTensor(int) y getOutputTensor(int) .

ADVERTENCIA: Las instancias InterpreterApi no son seguras para subprocesos.

ADVERTENCIA: Una instancia InterpreterApi posee recursos que deben liberarse explícitamente invocando close()

La biblioteca TFLite está construida con NDK API 19. Puede funcionar para niveles de API de Android inferiores a 19, pero no está garantizado.

Clases anidadas

clase InterpreterApi.Opciones Una clase de opciones para controlar el comportamiento del intérprete en tiempo de ejecución.

Métodos públicos

vacío abstracto	asignarTensores () Actualiza explícitamente las asignaciones para todos los tensores, si es necesario.
vacío abstracto	cerca () Libere los recursos asociados con la instancia `InterpreterApi` .
API de intérprete estática	crear (opciones de archivo modelFile, InterpreterApi.Options ) Construye una instancia `InterpreterApi` utilizando el modelo y las opciones especificados.
API de intérprete estática	crear ( ByteBuffer byteBuffer, opciones InterpreterApi.Options ) Construye una instancia `InterpreterApi` utilizando el modelo y las opciones especificados.
resumen entero	getInputIndex ( cadena nombre de operación) Obtiene el índice de una entrada dado el nombre de operación de la entrada.
tensor abstracto	getInputTensor (int índice de entrada) Obtiene el tensor asociado con el índice de entrada proporcionado.
resumen entero	getInputTensorCount () Obtiene el número de tensores de entrada.
abstracto largo	getLastNativeInferenceDurationNanosegundos () Devuelve el tiempo de inferencia nativo.
resumen entero	getOutputIndex ( cadena nombre de operación) Obtiene el índice de una salida dado el nombre de operación de la salida.
tensor abstracto	getOutputTensor (int índice de salida) Obtiene el tensor asociado con el índice de salida proporcionado.
resumen entero	getOutputTensorCount () Obtiene el número de tensores de salida.
vacío abstracto	resizeInput (int idx, int[] atenua, booleano estricto) Cambia el tamaño de la entrada idx-ésima del modelo nativo a las atenuaciones dadas.
vacío abstracto	resizeInput (int idx, int[] se atenúa) Cambia el tamaño de la entrada idx-ésima del modelo nativo a las atenuaciones dadas.
vacío abstracto	ejecutar (entrada de objeto , salida de objeto ) Ejecuta la inferencia del modelo si el modelo toma solo una entrada y proporciona solo una salida.
vacío abstracto	runForMultipleInputsOutputs ( Objeto[] entradas, Mapa < Entero , Objeto > salidas) Ejecuta la inferencia del modelo si el modelo toma múltiples entradas o devuelve múltiples salidas.

Métodos heredados

Desde la interfaz java.lang.AutoCloseable

vacío abstracto

cerca ()

Métodos públicos

asignación nula abstracta públicaTensores ()

Actualiza explícitamente las asignaciones para todos los tensores, si es necesario.

Esto propagará formas y asignaciones de memoria para tensores dependientes utilizando las formas del tensor de entrada tal como se proporcionan.

Nota: Esta llamada es *puramente opcional*. La asignación de tensores se producirá automáticamente durante la ejecución si se ha cambiado el tamaño de algún tensor de entrada. Esta llamada es más útil para determinar las formas de cualquier tensor de salida antes de ejecutar el gráfico, por ejemplo,

 interpreter.resizeInput(0, new int[]{1, 4, 4, 3}));
 interpreter.allocateTensors();
 FloatBuffer input = FloatBuffer.allocate(interpreter.getInputTensor(0).numElements());
 // Populate inputs...
 FloatBuffer output = FloatBuffer.allocate(interpreter.getOutputTensor(0).numElements());
 interpreter.run(input, output)
 // Process outputs...

Nota: Algunos gráficos tienen resultados con forma dinámica, en cuyo caso es posible que la forma de salida no se propague por completo hasta que se ejecute la inferencia.

Lanza

Excepción de estado ilegal	si los tensores del gráfico no se pudieron asignar con éxito.

resumen público vacío cerrar ()

Libere los recursos asociados con la instancia InterpreterApi .

Creación pública estática de InterpreterApi ( archivo modelFile, opciones InterpreterApi.Options )

Construye una instancia InterpreterApi utilizando el modelo y las opciones especificados. El modelo se cargará desde un archivo.

Parámetros

modeloArchivo	Un archivo que contiene un modelo TF Lite previamente entrenado.
opciones	Un conjunto de opciones para personalizar el comportamiento del intérprete.

Lanza

Argumento de excepción ilegal	si `modelFile` no codifica un modelo válido de TensorFlow Lite.

creación pública estática de InterpreterApi ( ByteBuffer byteBuffer, opciones InterpreterApi.Options )

Construye una instancia InterpreterApi utilizando el modelo y las opciones especificados. El modelo se leerá desde un ByteBuffer .

Parámetros

búfer de bytes	Un modelo TF Lite previamente entrenado, en formato serializado binario. ByteBuffer no debe modificarse después de la construcción de una instancia `InterpreterApi` . `ByteBuffer` puede ser un `MappedByteBuffer` que asigna en memoria un archivo de modelo o un `ByteBuffer` directo de NativeOrder() que contiene el contenido de bytes de un modelo.
opciones	Un conjunto de opciones para personalizar el comportamiento del intérprete.

Lanza

Argumento de excepción ilegal	si `byteBuffer` no es un `MappedByteBuffer` ni un `ByteBuffer` directo de NativeOrder.

resumen público int getInputIndex ( String opName)

Obtiene el índice de una entrada dado el nombre de operación de la entrada.

Parámetros

nombre de operación

Lanza

Argumento de excepción ilegal	si `opName` no coincide con ninguna entrada en el modelo utilizado para inicializar el intérprete.

Tensor abstracto público getInputTensor (int inputIndex)

Obtiene el tensor asociado con el índice de entrada proporcionado.

Parámetros

índice de entrada

Lanza

Argumento de excepción ilegal	si `inputIndex` es negativo o no es menor que el número de entradas del modelo.

resumen público int getInputTensorCount ()

Obtiene el número de tensores de entrada.

resumen público Long getLastNativeInferenceDurationNanosegundos ()

Devuelve el tiempo de inferencia nativo.

Lanza

Argumento de excepción ilegal	si el modelo no es inicializado por el intérprete.

resumen público int getOutputIndex ( String opName)

Obtiene el índice de una salida dado el nombre de operación de la salida.

Parámetros

nombre de operación

Lanza

Argumento de excepción ilegal	si `opName` no coincide con ninguna salida en el modelo utilizado para inicializar el intérprete.

Tensor abstracto público getOutputTensor (int outputIndex)

Obtiene el tensor asociado con el índice de salida proporcionado.

Nota: Es posible que los detalles del tensor de salida (p. ej., forma) no se rellenen por completo hasta que se ejecute la inferencia. Si necesita detalles actualizados *antes* de ejecutar la inferencia (por ejemplo, después de cambiar el tamaño de un tensor de entrada, lo que puede invalidar las formas del tensor de salida), use allocateTensors() para activar explícitamente la asignación y la propagación de formas. Tenga en cuenta que, para gráficos con formas de salida que dependen de *valores* de entrada, es posible que la forma de salida no se determine completamente hasta que se ejecute la inferencia.

Parámetros

índice de salida

Lanza

Argumento de excepción ilegal	si `outputIndex` es negativo o no es menor que el número de salidas del modelo.

resumen público int getOutputTensorCount ()

Obtiene el número de tensores de salida.

public abstract void resizeInput (int idx, int[] atenua, booleano estricto)

Cambia el tamaño de la entrada idx-ésima del modelo nativo a las atenuaciones dadas.

Cuando "estricto" es Verdadero, solo se pueden cambiar el tamaño de las dimensiones desconocidas. Las dimensiones desconocidas se indican como "-1" en la matriz devuelta por "Tensor.shapeSignature()".

Parámetros

identificación
se atenúa
estricto

Lanza

Argumento de excepción ilegal	si `idx` es negativo o no es menor que el número de entradas del modelo; o si se produce un error al cambiar el tamaño de la entrada idx-ésima. Además, el error se produce al intentar cambiar el tamaño de un tensor con dimensiones fijas cuando "estricto" es Verdadero.

public abstract void resizeInput (int idx, int[] atenuaciones)

Cambia el tamaño de la entrada idx-ésima del modelo nativo a las atenuaciones dadas.

Parámetros

identificación
se atenúa

Lanza

Argumento de excepción ilegal	si `idx` es negativo o no es menor que el número de entradas del modelo; o si se produce un error al cambiar el tamaño de la entrada idx-ésima.

ejecución pública abstracta vacía (entrada de objeto , salida de objeto )

Ejecuta la inferencia del modelo si el modelo toma solo una entrada y proporciona solo una salida.

Advertencia: La API es más eficiente si se utiliza un Buffer (preferiblemente directo, pero no obligatorio) como tipo de datos de entrada/salida. Considere utilizar Buffer para alimentar y recuperar datos primitivos para un mejor rendimiento. Se admiten los siguientes tipos Buffer concretos:

ByteBuffer : compatible con cualquier tipo de tensor primitivo subyacente.
FloatBuffer : compatible con tensores flotantes.
IntBuffer : compatible con tensores int32.
LongBuffer : compatible con tensores int64.

Tenga en cuenta que los tipos booleanos solo se admiten como matrices, no como Buffer o como entradas escalares.

Parámetros

aporte una matriz o matriz multidimensional, o un Buffer de tipos primitivos que incluyen int, float, long y byte. Buffer es la forma preferida de pasar datos de entrada grandes para tipos primitivos, mientras que los tipos de cadena requieren el uso de la ruta de entrada de matriz (multidimensional). Cuando se utiliza un Buffer , su contenido debe permanecer sin cambios hasta que se realice la inferencia del modelo, y la persona que llama debe asegurarse de que el Buffer esté en la posición de lectura adecuada. Se permite un valor null solo si la persona que llama utiliza un Delegate que permite la interoperabilidad del controlador del búfer y dicho búfer se ha vinculado al Tensor de entrada.

producción una matriz multidimensional de datos de salida o un Buffer de tipos primitivos que incluyen int, float, long y byte. Cuando se utiliza un Buffer , la persona que llama debe asegurarse de que esté configurado en la posición de escritura adecuada. Se permite un valor nulo y es útil en determinados casos, por ejemplo, si la persona que llama utiliza un Delegate que permite la interoperabilidad del manejo del búfer y dicho búfer se ha vinculado al Tensor de salida (consulte también Interpreter.Options#setAllowBufferHandleOutput(boolean) ), o si el gráfico tiene salidas con forma dinámica y la persona que llama debe consultar la forma Tensor salida después de invocar la inferencia, obteniendo los datos directamente del tensor de salida (a través de Tensor.asReadOnlyBuffer() ).

aporte	una matriz o matriz multidimensional, o un `Buffer` de tipos primitivos que incluyen int, float, long y byte. `Buffer` es la forma preferida de pasar datos de entrada grandes para tipos primitivos, mientras que los tipos de cadena requieren el uso de la ruta de entrada de matriz (multidimensional). Cuando se utiliza un `Buffer` , su contenido debe permanecer sin cambios hasta que se realice la inferencia del modelo, y la persona que llama debe asegurarse de que el `Buffer` esté en la posición de lectura adecuada. Se permite un valor `null` solo si la persona que llama utiliza un `Delegate` que permite la interoperabilidad del controlador del búfer y dicho búfer se ha vinculado al `Tensor` de entrada.
producción	una matriz multidimensional de datos de salida o un `Buffer` de tipos primitivos que incluyen int, float, long y byte. Cuando se utiliza un `Buffer` , la persona que llama debe asegurarse de que esté configurado en la posición de escritura adecuada. Se permite un valor nulo y es útil en determinados casos, por ejemplo, si la persona que llama utiliza un `Delegate` que permite la interoperabilidad del manejo del búfer y dicho búfer se ha vinculado al `Tensor` de salida (consulte también Interpreter.Options#setAllowBufferHandleOutput(boolean) ), o si el gráfico tiene salidas con forma dinámica y la persona que llama debe consultar la forma `Tensor` salida después de invocar la inferencia, obteniendo los datos directamente del tensor de salida (a través de `Tensor.asReadOnlyBuffer()` ).

Lanza

Argumento de excepción ilegal	si `input` es nula o está vacía, o si se produce un error al ejecutar la inferencia.
Argumento de excepción ilegal	(EXPERIMENTAL, sujeto a cambios) si la inferencia es interrumpida por `setCancelled(true)` .

public abstract void runForMultipleInputsOutputs ( Objeto[] entradas, Mapa < Entero , Objeto > salidas)

Ejecuta la inferencia del modelo si el modelo toma múltiples entradas o devuelve múltiples salidas.

Advertencia: La API es más eficiente si se utilizan Buffer (preferiblemente directos, pero no obligatorios) como tipos de datos de entrada/salida. Considere utilizar Buffer para alimentar y recuperar datos primitivos para un mejor rendimiento. Se admiten los siguientes tipos Buffer concretos:

ByteBuffer : compatible con cualquier tipo de tensor primitivo subyacente.
FloatBuffer : compatible con tensores flotantes.
IntBuffer : compatible con tensores int32.
LongBuffer : compatible con tensores int64.

Tenga en cuenta que los tipos booleanos solo se admiten como matrices, no como Buffer o como entradas escalares.

Nota: los valores null para elementos individuales de inputs y outputs solo se permiten si la persona que llama utiliza un Delegate que permite la interoperabilidad del manejo del búfer, y dicho búfer se ha vinculado a los Tensor de entrada o salida correspondientes.

Parámetros

entradas una serie de datos de entrada. Las entradas deben estar en el mismo orden que las entradas del modelo. Cada entrada puede ser una matriz o una matriz multidimensional, o un Buffer de tipos primitivos que incluyen int, float, long y byte. Buffer es la forma preferida de pasar datos de entrada grandes, mientras que los tipos de cadena requieren el uso de la ruta de entrada de la matriz (multidimensional). Cuando se utiliza Buffer , su contenido debe permanecer sin cambios hasta que se realice la inferencia del modelo, y la persona que llama debe asegurarse de que el Buffer esté en la posición de lectura adecuada.

salidas un mapa que asigna índices de salida a matrices multidimensionales de datos de salida o Buffer de tipos primitivos, incluidos int, float, long y byte. Solo necesita conservar las entradas para las salidas que se utilizarán. Cuando se utiliza un Buffer , la persona que llama debe asegurarse de que esté configurado en la posición de escritura adecuada. El mapa puede estar vacío en los casos en los que se utilizan identificadores de búfer para los datos del tensor de salida, o en los casos en los que las salidas tienen forma dinámica y el autor de la llamada debe consultar la forma del Tensor de salida después de invocar la inferencia, obteniendo los datos directamente del tensor de salida ( a través de Tensor.asReadOnlyBuffer() ).

entradas	una serie de datos de entrada. Las entradas deben estar en el mismo orden que las entradas del modelo. Cada entrada puede ser una matriz o una matriz multidimensional, o un `Buffer` de tipos primitivos que incluyen int, float, long y byte. `Buffer` es la forma preferida de pasar datos de entrada grandes, mientras que los tipos de cadena requieren el uso de la ruta de entrada de la matriz (multidimensional). Cuando se utiliza `Buffer` , su contenido debe permanecer sin cambios hasta que se realice la inferencia del modelo, y la persona que llama debe asegurarse de que el `Buffer` esté en la posición de lectura adecuada.
salidas	un mapa que asigna índices de salida a matrices multidimensionales de datos de salida o `Buffer` de tipos primitivos, incluidos int, float, long y byte. Solo necesita conservar las entradas para las salidas que se utilizarán. Cuando se utiliza un `Buffer` , la persona que llama debe asegurarse de que esté configurado en la posición de escritura adecuada. El mapa puede estar vacío en los casos en los que se utilizan identificadores de búfer para los datos del tensor de salida, o en los casos en los que las salidas tienen forma dinámica y el autor de la llamada debe consultar la forma del `Tensor` de salida después de invocar la inferencia, obteniendo los datos directamente del tensor de salida ( a través de `Tensor.asReadOnlyBuffer()` ).

Lanza

Argumento de excepción ilegal	si `inputs` son nulas o están vacías, si `outputs` son nulas o si se produce un error al ejecutar la inferencia.