Classificação de texto

Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Use um modelo do TensorFlow Lite para categorizar um parágrafo em grupos predefinidos.

iniciar

Se você é novo no TensorFlow Lite e está trabalhando com Android, recomendamos explorar o guia da Biblioteca de tarefas do TensorFLow Lite para integrar modelos de classificação de texto em apenas algumas linhas de código. Você também pode integrar o modelo usando a API Java do TensorFlow Lite Interpreter .

O exemplo do Android abaixo demonstra a implementação de ambos os métodos como lib_task_api e lib_interpreter , respectivamente.

Exemplo Android

Se você estiver usando uma plataforma diferente do Android ou já estiver familiarizado com as APIs do TensorFlow Lite, faça o download do nosso modelo de classificação de texto inicial.

Baixe o modelo inicial

Como funciona

A classificação de texto categoriza um parágrafo em grupos predefinidos com base em seu conteúdo.

Este modelo pré-treinado prevê se o sentimento de um parágrafo é positivo ou negativo. Ele foi treinado no Large Movie Review Dataset v1.0 de Mass et al, que consiste em resenhas de filmes do IMDB rotuladas como positivas ou negativas.

Aqui estão as etapas para classificar um parágrafo com o modelo:

  1. Tokenize o parágrafo e converta-o em uma lista de IDs de palavras usando um vocabulário predefinido.
  2. Alimente a lista para o modelo do TensorFlow Lite.
  3. Obtenha a probabilidade do parágrafo ser positivo ou negativo a partir das saídas do modelo.

Observação

  • Apenas o inglês é suportado.
  • Esse modelo foi treinado no conjunto de dados de resenhas de filmes para que você possa ter uma precisão reduzida ao classificar o texto de outros domínios.

Referências de desempenho

Os números de referência de desempenho são gerados com a ferramenta descrita aqui .

Nome do modelo Tamanho do modelo Dispositivo CPU
Classificação de texto 0,6 MB Pixel 3 (Android 10) 0,05 ms*
Pixel 4 (Android 10) 0,05 ms*
iPhone XS (iOS 12.4.1) 0,025 ms**

* 4 fios usados.

** 2 threads usadas no iPhone para obter o melhor resultado de desempenho.

Saída de exemplo

Texto Negativo (0) Positivo (1)
Este é o melhor filme que vi nos últimos anos. Recomendo vivamente! 25,3% 74,7%
Que desperdício do meu tempo. 72,5% 27,5%

Use seu conjunto de dados de treinamento

Siga este tutorial para aplicar a mesma técnica usada aqui para treinar um modelo de classificação de texto usando seus próprios conjuntos de dados. Com o conjunto de dados certo, você pode criar um modelo para casos de uso, como categorização de documentos ou detecção de comentários tóxicos.

Leia mais sobre classificação de texto