Classificação de texto

Use um modelo do TensorFlow Lite para categorizar um parágrafo em grupos predefinidos.

iniciar

Se você é novo no TensorFlow Lite e está trabalhando com Android, recomendamos explorar o guia da biblioteca de tarefas do TensorFLow Lite para integrar modelos de classificação de texto em apenas algumas linhas de código. Você também pode integrar o modelo usando a API Java do interpretador do TensorFlow Lite .

O exemplo Android abaixo demonstra a implementação de ambos os métodos lib_task_api e lib_interpreter , respectivamente.

Exemplo Android

Se você estiver usando uma plataforma diferente do Android ou já estiver familiarizado com as APIs do TensorFlow Lite, poderá fazer download do nosso modelo inicial de classificação de texto.

Baixe o modelo inicial

Como funciona

A classificação de texto categoriza um parágrafo em grupos predefinidos com base em seu conteúdo.

Este modelo pré-treinado prevê se o sentimento de um parágrafo é positivo ou negativo. Ele foi treinado no Large Movie Review Dataset v1.0 de Mass et al, que consiste em resenhas de filmes do IMDB rotuladas como positivas ou negativas.

Aqui estão as etapas para classificar um parágrafo com o modelo:

  1. Tokenize o parágrafo e converta-o em uma lista de IDs de palavras usando um vocabulário predefinido.
  2. Alimente a lista ao modelo TensorFlow Lite.
  3. Obtenha a probabilidade de o parágrafo ser positivo ou negativo a partir dos resultados do modelo.

Observação

  • Apenas o inglês é suportado.
  • Este modelo foi treinado em um conjunto de dados de resenhas de filmes para que você possa ter precisão reduzida ao classificar textos de outros domínios.

Referências de desempenho

Os números de benchmark de desempenho são gerados com a ferramenta descrita aqui .

Nome do modelo Tamanho do modelo Dispositivo CPU
Classificação de texto 0,6 MB Pixel 3 (Android 10) 0,05ms*
Pixel 4 (Android 10) 0,05ms*
iPhone XS (iOS 12.4.1) 0,025ms**

* 4 fios usados.

** 2 threads usados ​​no iPhone para melhor resultado de desempenho.

Exemplo de saída

Texto Negativo (0) Positivo (1)
Este é o melhor filme que vi nos últimos anos. Recomendo vivamente! 25,3% 74,7%
Que desperdício do meu tempo. 72,5% 27,5%

Use seu conjunto de dados de treinamento

Siga este tutorial para aplicar a mesma técnica usada aqui para treinar um modelo de classificação de texto usando seus próprios conjuntos de dados. Com o conjunto de dados certo, você pode criar um modelo para casos de uso como categorização de documentos ou detecção de comentários tóxicos.

Leia mais sobre classificação de texto