Classement du texte

Utilisez un modèle TensorFlow Lite pour classer un paragraphe en groupes prédéfinis.

Commencer

Si vous êtes nouveau sur TensorFlow Lite et que vous travaillez avec Android, nous vous recommandons d'explorer le guide de la bibliothèque de tâches TensorFLow Lite pour intégrer des modèles de classification de texte en quelques lignes de code seulement. Vous pouvez également intégrer le modèle à l'aide de l' API Java TensorFlow Lite Interpreter .

L'exemple Android ci-dessous montre l'implémentation des deux méthodes respectivement lib_task_api et lib_interpreter .

Exemple Android

Si vous utilisez une plateforme autre qu'Android ou si vous connaissez déjà les API TensorFlow Lite, vous pouvez télécharger notre modèle de classification de texte de démarrage.

Télécharger le modèle de démarrage

Comment ça fonctionne

La classification de texte classe un paragraphe en groupes prédéfinis en fonction de son contenu.

Ce modèle pré-entraîné prédit si le sentiment d'un paragraphe est positif ou négatif. Il a été formé sur le Large Movie Review Dataset v1.0 de Mass et al, qui se compose de critiques de films IMDB étiquetées comme positives ou négatives.

Voici les étapes pour classer un paragraphe avec le modèle :

  1. Tokenisez le paragraphe et convertissez-le en une liste d'identifiants de mots à l'aide d'un vocabulaire prédéfini.
  2. Alimentez la liste vers le modèle TensorFlow Lite.
  3. Obtenez la probabilité que le paragraphe soit positif ou négatif à partir des sorties du modèle.

Note

  • Seul l'anglais est pris en charge.
  • Ce modèle a été formé sur un ensemble de données de critiques de films, vous pouvez donc constater une précision réduite lors de la classification du texte d'autres domaines.

Repères de performances

Les numéros de référence de performance sont générés avec l'outil décrit ici .

Nom du modèle Taille du modèle Appareil CPU
Classement du texte 0,6 Mo Pixel 3 (Android 10) 0,05 ms*
Pixel 4 (Android 10) 0,05 ms*
iPhone XS (iOS 12.4.1) 0,025 ms**

* 4 fils utilisés.

** 2 threads utilisés sur iPhone pour le meilleur résultat de performances.

Exemple de sortie

Texte Négatif (0) Positif (1)
C'est le meilleur film que j'ai vu ces dernières années. Je le recommande vivement ! 25,3% 74,7%
Quelle perte de temps. 72,5% 27,5%

Utilisez votre ensemble de données d'entraînement

Suivez ce didacticiel pour appliquer la même technique que celle utilisée ici pour entraîner un modèle de classification de texte à l'aide de vos propres ensembles de données. Avec le bon ensemble de données, vous pouvez créer un modèle pour des cas d'utilisation tels que la catégorisation de documents ou la détection de commentaires toxiques.

En savoir plus sur la classification des textes