画像分類器の統合

画像分類は、一般的な機械学習の使用例で、機械学習を使用して画像が表すものを識別します。たとえば、特定の写真にどのような種類の動物が写っているのかを知りたい場合に画像が何を表すかを予測するタスクは、画像分類と呼ばれます。画像分類器は、画像のさまざまなクラスを認識するようにトレーニングされています。たとえば、ウサギ、ハムスター、犬の3種類の動物を表す写真を認識するようにモデルをトレーニングすることができます。画像分類器の詳細については、画像分類の概要をご覧ください。

Task Library ImageClassifier APIを使用して、カスタム画像分類器または事前トレーニング済みのものをモデルアプリにデプロイします。

ImageClassifier API の主な機能

  • 回転、サイズ変更、色空間変換などの入力画像処理。

  • 入力画像の関心領域。

  • マップロケールのラベル付け。

  • 結果をフィルタリングするスコアしきい値。

  • Top-k 分類結果。

  • 許可リストと拒否リストのラベルを付け。

サポートされている画像分類モデル

次のモデルは、ImageClassifier API との互換性が保証されています。

Java で推論を実行する

Android アプリケーションでImageClassifierを使用する方法の例については、画像分類リファレンスアプリを参照してください。

ステップ 1: Gradle の依存関係とその他の設定をインポートする

.tfliteモデルファイルを、モデルが実行される Android モジュールのアセットディレクトリにコピーします。ファイルを圧縮しないように指定し、TensorFlow Lite ライブラリをモジュールのbuild.gradleファイルに追加します。

android {
    // Other settings

    // Specify tflite file should not be compressed for the app apk
    aaptOptions {
        noCompress "tflite"
    }

}

dependencies {
    // Other dependencies

    // Import the Task Vision Library dependency
    implementation 'org.tensorflow:tensorflow-lite-task-vision:0.1.0'
}

ステップ 2: モデルを使用する

// Initialization
ImageClassifierOptions options = ImageClassifierOptions.builder().setMaxResults(1).build();
ImageClassifier imageClassifier = ImageClassifier.createFromFileAndOptions(context, modelFile, options);

// Run inference
List<Classifications> results = imageClassifier.classify(image);

ImageClassifierを構成するその他のオプションについては、ソースコードと javadoc をご覧ください。

C++ で推論を実行する

注: C++ Task Library では、使いやすさを向上するために構築済みのバイナリを提供したり、ユーザーフレンドリーなワークフローを作成してソースコードから構築できるようしています。C++ API は変更される可能性があります。

// Initialization
ImageClassifierOptions options;
options.mutable_model_file_with_metadata()->set_file_name(model_file);
std::unique_ptr<ImageClassifier> image_classifier = ImageClassifier::CreateFromOptions(options).value();

// Run inference
const ClassificationResult result = image_classifier->Classify(*frame_buffer).value();

ImageClassifierを構成するその他のオプションについては、ソースコードをご覧ください。

結果の例

以下は、鳥分類器の分類結果の例です。

sparrow

Results:
  Rank #0:
   index       : 671
   score       : 0.91406
   class name  : /m/01bwb9
   display name: Passer domesticus
  Rank #1:
   index       : 670
   score       : 0.00391
   class name  : /m/01bwbt
   display name: Passer montanus
  Rank #2:
   index       : 495
   score       : 0.00391
   class name  : /m/0bwm6m
   display name: Passer italiae

独自のモデルとテストデータを使用して、シンプルなImageClassifier用 CLI デモツールをお試しください。

モデルの互換性要件

ImageClassifier API では、 TFLite モデルメタデータを持つ TFLite モデル が必要です。

互換性のある画像分類モデルは、次の要件を満たす必要があります。

  • 入力画像テンソル (kTfLiteUInt8/kTfLiteFloat32)

    • サイズ[batch x height x width x channels]の画像入力。
    • バッチ推論はサポートされていません (batchは 1 である必要があります)。
    • RGB 入力のみがサポートされています (channelsは 3 である必要があります)。
    • 型が kTfLiteFloat32 の場合、入力の正規化のためにメタデータに NormalizationOptions をアタッチする必要があります。
  • 出力画像テンソル (kTfLiteUInt8/kTfLiteFloat32)

    • N クラスと 2 次元または 4 次元のいずれか ([1 x N]または[1 x 1 x 1 x N])
    • TENSOR_AXIS_LABELS 型の AssociatedFile ラベルマップ (オプションですが推薦されます)。1 行に 1 つのラベルが含まれます。最初の AssociatedFile (存在する場合) は、結果のlabelフィールド (C ++ではclass_nameと名付けられています) を入力ために使用されます。display_nameフィールドは、AssociatedFile (存在する場合) から入力されます。そのロケールは、作成時に使用されるImageClassifierOptionsdisplay_names_localeフィールドと一致します(デフォルトでは「en (英語)」)。これらのいずれも使用できない場合、結果のindexフィールドのみが入力されます。