使用预训练的模型将段落分类到预定义组中。
开始
如果您是 TensorFlow Lite 新用户,并且使用的是 Android 平台,我们建议您研究以下可以帮助您入门的示例应用。
如果您使用的不是 Android 平台,或者您已经熟悉 TensorFlow Lite API,则可以下载我们的起始文本分类模型。
工作方式
文本分类根据内容将段落分类到预定义组中。
此预训练模型可预测段落的情感是正面的还是负面的。它在 Mass 等人提供的 Large Movie Review Dataset v1.0 上进行训练,该数据集包含标记为正面或负面的 IMDB 电影评论。
下面是使用该模型对段落进行分类的步骤:
- 对段落进行分词,并使用预定义词汇表将其转换为一个单词 ID 列表。
- 将该列表馈送到 TensorFlow Lite 模型。
- 从模型输出获取该段落为正面或负面评价的概率。
说明
- 仅支持英语。
- 此模型在电影评论数据集上进行训练,因此,对其他领域的文本进行分类时,您可能发现准确率有所降低。
性能基准
性能基准数值通过使用此处所述工具生成。
模型名称 | 模型大小 | 设备 | CPU |
---|---|---|---|
文本分类 | 0.6 Mb | Pixel 3 (Android 10) | 0.05ms* |
Pixel 4 (Android 10) | 0.05ms* | ||
iPhone XS (iOS 12.4.1) | 0.025ms** |
- 使用 4 个线程。
** 为了获得最佳性能结果,在 iPhone 上使用 2 个线程。
示例输出
Text | Negative (0) | Positive (1) |
---|---|---|
This is the best movie I’ve seen in recent | 25.3% | 74.7% |
: years. Strongly recommend it! : : : | ||
What a waste of my time. | 72.5% | 27.5% |
使用训练数据集
使用您自己的数据集,按照本教程运用本文使用的相同技术训练文本分类模型。利用正确的数据集,您可以为文档分类或负面评论检测等用例创建模型。