TensorFlow を使用したコンピューター ビジョン

TensorFlow は、多数のコンピューター ビジョン (CV) および画像分類ツールを提供します。このドキュメントでは、これらのツールのいくつかを紹介し、一般的な CV タスクを開始するのに役立つリソースの概要を提供します。

ビジョンライブラリとツール

TensorFlow は、上位レベルの Keras ライブラリと下位レベルのtf.imageモジュールを通じて CV ツールを提供します。ほとんどのユースケースでは、組み込みの TensorFlow 代替ライブラリよりも Keras ライブラリの方が便利です。ただし、Keras オプションがユースケースに適合しない場合、または画像の前処理を下位レベルで制御したい場合は、下位レベルの TensorFlow ツールが必要になる可能性があります。

ケラスCV

CV プロジェクトを始めたばかりで、どのライブラリやツールが必要になるかわからない場合は、 KerasCVから始めるのが良いでしょう。 KerasCV は、Keras Core 上に構築されたモジュラー CV コンポーネントのライブラリです。 KerasCV には、モデル、レイヤー、メトリクス、コールバック、および CV タスク用の高レベルの Keras API を拡張するその他のツールが含まれています。 KerasCV API は、データ拡張、分類、オブジェクト検出、セグメンテーション、画像生成、その他の一般的な CV ワークフローに役立ちます。 KerasCV を使用すると、本番グレードの最先端のトレーニングおよび推論パイプラインを迅速に組み立てることができます。

Keras ユーティリティ

tf.keras.utils 、いくつかの高レベルの画像前処理ユーティリティを提供します。たとえば、 tf.keras.utils.image_dataset_from_directory 、ディスク上のイメージのディレクトリからtf.data.Datasetを生成します。

tf.image

KerasCV がユースケースに適合しない場合は、 tf.imagetf.dataを使用して独自のデータ拡張パイプラインまたはレイヤーを作成できます。

tf.imageモジュールには、 tf.image.flip_left_righttf.image.rgb_to_grayscaletf.image.adjust_brightnesstf.image.central_croptf.image.stateless_random*などの画像処理のためのさまざまな関数が含まれています。

tf.data API を使用すると、単純で再利用可能な部分から複雑な入力パイプラインを構築できます。

TensorFlow データセット

TensorFlow Datasets は、 TensorFlow ですぐに使用できるデータセットのコレクションです。データセットの多く (たとえば、 MNISTFashion-MNIST 、およびTF Flowers ) は、コンピューター ビジョン アルゴリズムの開発とテストに使用できます。

どこから始めれば

次のリソースは、TensorFlow および Keras CV ツールを立ち上げて実行するのに役立ちます。