TensorFlow が 5 月 14 日の Google I/O に戻ってきます。今すぐ登録

このページは Cloud Translation API によって翻訳されました。

AudioClassifier

パブリック最終クラスAudioClassifier

音声波形の分類を実行します。

API は、 TFLite モデルメタデータを含む TFLite モデルを想定しています。。

API は、1 つの音声入力テンソルと 1 つの分類出力テンソルを持つモデルをサポートします。より具体的に言うと、次のような要件があります。

入力オーディオテンソル ( kTfLiteFloat32 )
- サイズ[batch x samples]の入力オーディオバッファー。
- バッチ推論はサポートされていません ( batch 1 である必要があります)。
出力スコアテンソル ( kTfLiteFloat32 )
- [1 x N]や[1 x 1 x 1 x N]など、2 次元または 4 次元のNクラスを使用します。
- ラベルファイルをメタデータにパックする必要があります。画像分類器のメタデータの作成例を参照してください。ラベルファイルがパックされていない場合は、結果のラベルとしてインデックスが使用されます。

このようなモデルの例と、この API を簡単に試すためのCLI デモツールをご覧ください。

ネストされたクラス

クラス AudioClassifier.AudioClassifierOptions AudioClassifierをセットアップするためのオプション。

パブリックメソッド

一覧<分類>	分類( TensorAudioテンソル) 提供されたオーディオテンソルに対して実際の分類を実行します。
オーディオレコード	createAudioRecord () オーディオストリームを録音するための`AudioRecord`インスタンスを作成します。
静的AudioClassifier	createFromBuffer ( ByteBuffer modelBuffer) モデルバッファーとデフォルトの`AudioClassifier.AudioClassifierOptions`を使用して`AudioClassifier`インスタンスを作成します。
静的AudioClassifier	createFromBufferAndOptions ( ByteBuffer modelBuffer、 AudioClassifier.AudioClassifierOptionsオプション) モデルバッファーと`AudioClassifier.AudioClassifierOptions`を使用して`AudioClassifier`インスタンスを作成します。
静的AudioClassifier	createFromFile (コンテキスト context、文字列モデルパス) デフォルトの`AudioClassifier.AudioClassifierOptions`から`AudioClassifier`インスタンスを作成します。
静的AudioClassifier	createFromFile (ファイルモデルファイル) デフォルトの`AudioClassifier.AudioClassifierOptions`から`AudioClassifier`インスタンスを作成します。
静的AudioClassifier	createFromFileAndOptions (コンテキストコンテキスト、文字列モデルパス、 AudioClassifier.AudioClassifierOptionsオプション) `AudioClassifier.AudioClassifierOptions`から`AudioClassifier`インスタンスを作成します。
静的AudioClassifier	createFromFileAndOptions (ファイルモデルファイル、 AudioClassifier.AudioClassifierOptionsオプション) `AudioClassifier`インスタンスを作成します。
TensorAudio	createInputTensorAudio () `TensorAudio`インスタンスを作成して、入力オーディオサンプルを保存します。
長さ	getRequiredInputBufferSize () 必要な入力バッファサイズを float 要素の数で返します。
TensorAudio.TensorAudioFormat	getRequiredTensorAudioFormat () モデルに必要な`TensorAudio.TensorAudioFormat`を返します。

継承されたメソッド

クラスorg.tensorflow.lite.task.core.BaseTaskApiから

同期ボイド	近い（） C++ から割り当てられたメモリを解放し、静的ホルダーからライブラリの登録を解除します。
長さ	getNativeHandle ()
ブール値	閉じています（）

クラスjava.lang.Objectから

ブール値	等しい(オブジェクトarg0)
最終クラス<?>	getクラス()
整数	ハッシュコード（）
最後の空白	通知する()
最後の空白	すべて通知()
弦	toString ()
最後の空白	wait (long arg0, int arg1)
最後の空白	待機(長い引数0)
最後の空白	待って（）

インターフェース java.io.Closeable から

抽象的な空白

近い（）

インターフェース java.lang.AutoCloseable から

抽象的な空白

近い（）

パブリックメソッド

public List <分類>分類( TensorAudioテンソル)

提供されたオーディオテンソルに対して実際の分類を実行します。

パラメーター

テンソル	[-1, 1) の間の値を持つ float 形式の入力オーディオクリップを含む`TensorAudio` 。 `tensor`引数は、TFLite モデルの入力テンソルと同じフラットサイズを持つ必要があります。 `createInputTensorAudio`メソッドを使用して`tensor`を作成することをお勧めします。

投げる

IllegalArgumentException	引数が無効な場合
IllegalStateException	ネイティブコードからオーディオクリップを分類するときにエラーが発生した場合

public AudioRecord createAudioRecord ()

オーディオストリームを録音するためのAudioRecordインスタンスを作成します。返された AudioRecord インスタンスは初期化されており、クライアントは録音を開始するためにAudioRecord.startRecordingnullメソッドを呼び出す必要があります。

戻り値

AudioRecord.STATE_INITIALIZEDのAudioRecordインスタンス

投げる

IllegalArgumentException	必要なチャンネル数がサポートされていないモデルの場合
IllegalStateException	AudioRecord インスタンスの初期化に失敗した場合

public static AudioClassifier createFromBuffer ( ByteBuffer modelBuffer)

モデルバッファーとデフォルトのAudioClassifier.AudioClassifierOptionsを使用してAudioClassifierインスタンスを作成します。

パラメーター

モデルバッファ	分類モデルの直接`ByteBuffer`または`MappedByteBuffer`

投げる

IllegalStateException	内部エラーがある場合
ランタイム例外	他に特定されていないエラーがある場合
IllegalArgumentException	モデルバッファーが直接`ByteBuffer`または`MappedByteBuffer`ではない場合

public static AudioClassifier createFromBufferAndOptions ( ByteBuffer modelBuffer、 AudioClassifier.AudioClassifierOptionsオプション)

モデルバッファーとAudioClassifier.AudioClassifierOptionsを使用してAudioClassifierインスタンスを作成します。

パラメーター

モデルバッファ	分類モデルの直接`ByteBuffer`または`MappedByteBuffer`
オプション

投げる

IllegalStateException	内部エラーがある場合
ランタイム例外	他に特定されていないエラーがある場合
IllegalArgumentException	モデルバッファーが直接`ByteBuffer`または`MappedByteBuffer`ではない場合

public static AudioClassifier createFromFile (Context context, String modelPath)

デフォルトのAudioClassifier.AudioClassifierOptionsからAudioClassifierインスタンスを作成します。

パラメーター

コンテクスト
モデルパス	アセット内のメタデータを含む分類モデルのパス

投げる

IO例外	tflite モデルのロード時に I/O エラーが発生した場合
IllegalArgumentException	引数が無効な場合
IllegalStateException	内部エラーがある場合
ランタイム例外	他に特定されていないエラーがある場合

public static AudioClassifier createFromFile ( File modelFile)

デフォルトのAudioClassifier.AudioClassifierOptionsからAudioClassifierインスタンスを作成します。

パラメーター

モデルファイル	分類モデル`File`インスタンス

投げる

IO例外	tflite モデルのロード時に I/O エラーが発生した場合
IllegalArgumentException	引数が無効な場合
IllegalStateException	内部エラーがある場合
ランタイム例外	他に特定されていないエラーがある場合

public static AudioClassifier createFromFileAndOptions (Context context、 String modelPath、 AudioClassifier.AudioClassifierOptionsオプション)

AudioClassifier.AudioClassifierOptionsからAudioClassifierインスタンスを作成します。

パラメーター

コンテクスト
モデルパス	アセット内のメタデータを含む分類モデルのパス
オプション

投げる

IO例外	tflite モデルのロード時に I/O エラーが発生した場合
IllegalArgumentException	引数が無効な場合
IllegalStateException	内部エラーがある場合
ランタイム例外	他に特定されていないエラーがある場合

public static AudioClassifier createFromFileAndOptions (ファイルmodelFile、 AudioClassifier.AudioClassifierOptionsオプション)

AudioClassifierインスタンスを作成します。

パラメーター

モデルファイル	分類モデル`File`インスタンス
オプション

投げる

IO例外	tflite モデルのロード時に I/O エラーが発生した場合
IllegalArgumentException	引数が無効な場合
IllegalStateException	内部エラーがある場合
ランタイム例外	他に特定されていないエラーがある場合

public TensorAudio createInputTensorAudio ()

TensorAudioインスタンスを作成して、入力オーディオサンプルを保存します。

戻り値

モデル入力テンソルと同じサイズのTensorAudio

投げる

IllegalArgumentException	モデルに互換性がない場合

public long getRequiredInputBufferSize ()

必要な入力バッファサイズを float 要素の数で返します。

public TensorAudio.TensorAudioFormat getRequiredTensorAudioFormat ()

モデルに必要なTensorAudio.TensorAudioFormatを返します。