Помогают защитить Большой Барьерный Риф с TensorFlow на Kaggle Присоединяйтесь вызов

Классификация текста

Используйте модель TensorFlow Lite, чтобы разделить абзац на заранее определенные группы.

Начать

Если вы новичок в TensorFlow Lite и работаете с Android, мы рекомендуем изучить руководство по библиотеке задач TensorFLow Lite, чтобы интегрировать модели классификации текста в несколько строк кода. Вы также можете интегрировать модель с помощью API Java интерпретатора TensorFlow Lite .

В приведенном ниже примере Android демонстрируется реализация обоих методов как lib_task_api и lib_interpreter соответственно.

Пример Android

Если вы используете платформу, отличную от Android, или уже знакомы с API-интерфейсами TensorFlow Lite, вы можете загрузить нашу стартовую модель классификации текста.

Скачать стартовую модель

Как это работает

Классификация текста разбивает абзацы на предопределенные группы в зависимости от его содержания.

Эта предварительно обученная модель предсказывает, будет ли тональность абзаца положительной или отрицательной. Он был обучен на наборе данных Large Movie Review Dataset v1.0 от Mass et al, который состоит из обзоров фильмов IMDB, помеченных как положительные или отрицательные.

Вот шаги, чтобы классифицировать абзац с помощью модели:

  1. Обозначьте абзац и преобразуйте его в список идентификаторов слов, используя предопределенный словарь.
  2. Подайте список в модель TensorFlow Lite.
  3. Получите вероятность того, что абзац будет положительным или отрицательным, из выходных данных модели.

Примечание

  • Поддерживается только английский язык.
  • Эта модель была обучена на наборе данных обзоров фильмов, поэтому вы можете столкнуться с пониженной точностью при классификации текста из других доменов.

Тесты производительности

Цифры тестов производительности генерируются с помощью описанного здесь инструмента.

Название модели Размер модели Устройство Процессор
Текстовая классификация 0,6 Мб Pixel 3 (Android 10) 0,05 мс *
Pixel 4 (Android 10) 0,05 мс *
iPhone XS (iOS 12.4.1) 0,025 мс **

* Использовано 4 нитки.

** 2 потока используются на iPhone для достижения наилучшего результата.

Пример вывода

Текст Отрицательные (0) Положительные (1)
Это лучший фильм, который я видел за последние годы. Настоятельно рекомендую! 25,3% 74,7%
Что за трата моего времени. 72,5% 27,5%

Используйте свой набор тренировочных данных

Следуйте этому руководству, чтобы применить ту же технику, что и здесь, для обучения модели классификации текста с использованием ваших собственных наборов данных. С правильным набором данных вы можете создать модель для таких случаев использования, как категоризация документов или обнаружение токсичных комментариев.

Узнать больше о классификации текста