テキスト分類

TensorFlow Lite モデルを使用して、段落を事前定義されたグループに分類します。

始めましょう

TensorFlow Lite を初めて使用し、Android を使用している場合は、 TensorFlow Lite タスク ライブラリのガイドを参照して、わずか数行のコード内にテキスト分類モデルを統合することをお勧めします。 TensorFlow Lite インタープリター Java APIを使用してモデルを統合することもできます。

以下の Android の例は、両方のメソッドの実装をそれぞれlib_task_apilib_interpreterとして示しています。

Androidの例

Android 以外のプラットフォームを使用している場合、またはすでに TensorFlow Lite API に精通している場合は、スターター テキスト分類モデルをダウンロードできます。

スターターモデルをダウンロード

使い方

テキスト分類では、段落をその内容に基づいて事前定義されたグループに分類します。

この事前トレーニング済みモデルは、段落の感情が肯定的か否定的かを予測します。これは、Mass らによるLarge Movie Review Dataset v1.0でトレーニングされました。これは、ポジティブまたはネガティブのいずれかに分類された IMDB 映画レビューで構成されています。

モデルを使用して段落を分類する手順は次のとおりです。

  1. 段落をトークン化し、事前定義された語彙を使用して単語 ID のリストに変換します。
  2. リストを TensorFlow Lite モデルにフィードします。
  3. モデルの出力から段落が正または負である確率を取得します。

注記

  • 英語のみがサポートされています。
  • このモデルは映画レビュー データセットでトレーニングされたため、他のドメインのテキストを分類する際に精度が低下する可能性があります。

パフォーマンスのベンチマーク

パフォーマンス ベンチマークの数値は、ここで説明するツールを使用して生成されます。

モデル名モデルサイズデバイスCPU
テキストの分類0.6MBピクセル 3 (Android 10) 0.05ms*
ピクセル 4 (Android 10) 0.05ms*
iPhone XS(iOS 12.4.1) 0.025ミリ秒**

※糸は4本使用。

** 最高のパフォーマンス結果を得るために、iPhone では 2 つのスレッドが使用されます。

出力例

文章マイナス (0)ポジティブ (1)
これは私が近年見た中で最高の映画です。強くお勧めします! 25.3% 74.7%
なんという時間の無駄だろう。 72.5% 27.5%

トレーニング データセットを使用する

このチュートリアルに従って、ここで使用したのと同じ手法を適用して、独自のデータセットを使用してテキスト分類モデルをトレーニングします。適切なデータセットを使用すると、ドキュメントの分類や有害なコメントの検出などのユースケース用のモデルを作成できます。

テキスト分類の詳細を読む