O Dia da Comunidade de ML é dia 9 de novembro! Junte-nos para atualização de TensorFlow, JAX, e mais Saiba mais

Classificação de texto

Use um modelo do TensorFlow Lite para categorizar um parágrafo em grupos predefinidos.

iniciar

Se você é novo no TensorFlow Lite e está trabalhando com Android, recomendamos explorar o guia da Biblioteca de Tarefas do TensorFLow Lite para integrar modelos de classificação de texto em apenas algumas linhas de código. Você também pode integrar o modelo usando a API TensorFlow Lite Interpreter Java .

O exemplo do Android abaixo demonstra a implementação de ambos os métodos como lib_task_api e lib_interpreter , respectivamente.

Exemplo de Android

Se você estiver usando uma plataforma diferente do Android ou já estiver familiarizado com as APIs do TensorFlow Lite, pode fazer o download de nosso modelo de classificação de texto inicial.

Baixe o modelo inicial

Como funciona

A classificação de texto categoriza um parágrafo em grupos predefinidos com base em seu conteúdo.

Este modelo pré-treinado prevê se o sentimento de um parágrafo é positivo ou negativo. Ele foi treinado no Large Movie Review Dataset v1.0 de Mass et al, que consiste em resenhas de filmes IMDB marcadas como positivas ou negativas.

Aqui estão as etapas para classificar um parágrafo com o modelo:

  1. Tokenize o parágrafo e converta-o em uma lista de ids de palavras usando um vocabulário predefinido.
  2. Alimente a lista para o modelo TensorFlow Lite.
  3. Obtenha a probabilidade de o parágrafo ser positivo ou negativo a partir dos resultados do modelo.

Observação

  • Apenas o inglês é compatível.
  • Este modelo foi treinado no conjunto de dados de resenhas de filmes para que você possa ter uma precisão reduzida ao classificar o texto de outros domínios.

Benchmarks de desempenho

Os números de referência de desempenho são gerados com a ferramenta descrita aqui .

Nome do Modelo Tamanho do modelo Dispositivo CPU
Classificação de Texto 0,6 Mb Pixel 3 (Android 10) 0,05 ms *
Pixel 4 (Android 10) 0,05 ms *
iPhone XS (iOS 12.4.1) 0,025 ms **

* 4 fios usados.

** 2 fios usados ​​no iPhone para o melhor resultado de desempenho.

Saída de exemplo

Texto Negativo (0) Positivo (1)
Este é o melhor filme que vi nos últimos anos. Recomendo fortemente! 25,3% 74,7%
Que desperdício do meu tempo. 72,5% 27,5%

Use seu conjunto de dados de treinamento

Siga este tutorial para aplicar a mesma técnica usada aqui para treinar um modelo de classificação de texto usando seus próprios conjuntos de dados. Com o conjunto de dados correto, você pode criar um modelo para casos de uso, como categorização de documentos ou detecção de comentários tóxicos.

Leia mais sobre classificação de texto