Google I / Oが5月18〜20日に戻ってきます。スペースを予約してスケジュールを作成する今すぐ登録する

BERT 自然言語分類器の統合

Task Library のBertNLClassifierAPI は、入力テキストをさまざまなカテゴリに分類するNLClassifierとよく似ていますが、この API は、TFLite モデルの外で Wordpiece および Sentencepiece トークン化を必要とする Bert 関連モデル専用に設計されています。

BertNLClassifier API の主な機能

  • 単一の文字列を入力として受け取り、その文字列で分類を実行し、分類の結果として <Label、Score> のペアを出力します。

  • 入力するテキストに対してグラフ外で Wordpiece または Sentencepiece トークン化を実行します。

サポートされている BertNLClassifier モデル

以下のモデルは、BertNLClassifier API と互換性があります。

Java で推論を実行する

ステップ 1: Gradle の依存関係とその他の設定をインポートする

.tfliteモデルファイルを、モデルが実行される Android モジュールのアセットディレクトリにコピーします。ファイルを圧縮しないように指定し、TensorFlow Lite ライブラリをモジュールのbuild.gradleファイルに追加します。

android {
    // Other settings

    // Specify tflite file should not be compressed for the app apk
    aaptOptions {
        noCompress "tflite"
    }

}

dependencies {
    // Other dependencies

    // Import the Task Text Library dependency
    implementation 'org.tensorflow:tensorflow-lite-task-text:0.1.0'
}

ステップ 2: API を使用して推論を実行する

// Initialization
BertNLClassifier classifier = BertNLClassifier.createFromFile(context, modelFile);

// Run inference
List<Category> results = classifier.classify(input);

詳細についてはソースコードをご覧ください。

Swift で推論を実行する

ステップ 1: CocoaPods をインポートする

Podfile に TensorFlowLiteTaskText ポッドを追加します

target 'MySwiftAppWithTaskAPI' do
  use_frameworks!
  pod 'TensorFlowLiteTaskText', '~> 0.0.1-nightly'
end

ステップ 2: API を使用して推論を実行する

// Initialization
let bertNLClassifier = TFLBertNLClassifier.bertNLClassifier(
      modelPath: bertModelPath)

// Run inference
let categories = bertNLClassifier.classify(text: input)

詳細についてはソースコードをご覧ください。

C++ で推論を実行する

注: C++ Task Library では、使いやすさを向上するために構築済みのバイナリを提供したり、ユーザーフレンドリーなワークフローを作成してソースコードから構築できるようしています。C++ API は変更される可能性があります。

// Initialization
std::unique_ptr<BertNLClassifier> classifier = BertNLClassifier::CreateFromFile(model_path).value();

// Run inference
std::vector<core::Category> categories = classifier->Classify(kInput);

詳細についてはソースコードをご覧ください。

結果の例

これは、モデルメーカーの MobileBert モデルを使用した映画レビューの分類結果の例です。

入力: "it's a charming and often affecting journey"

出力:

category[0]: 'negative' : '0.00006'
category[1]: 'positive' : '0.99994'

独自のモデルとテストデータを使用して、シンプルな BertNLClassifier 用 CLI デモツールを試してみてください。

モデルの互換性要件

BetNLClassifier API では、 TFLite モデルメタデータを持つ TFLite モデルが必要です。

メタデータは次の要件を満たす必要があります。

  • Wordpiece/Sentencepiece Tokenizer の input_process_units

  • Tokenizer の出力用の「ids」、「mask」、「segment_ids」という名前の 3 つの入力テンソル

  • float32 型の 1 つの出力テンソル。オプションでラベルファイルが添付されている場合があります。ラベルファイルが添付されている場合、ファイルは 1 行に 1 つのラベルが付いたプレーンテキストファイルである必要があり、ラベルの数はモデルの出力としてカテゴリの数と一致する必要があります。