Mfcc

パブリック最終クラスMfcc

スペクトログラムを音声認識に役立つ形式に変換します。

メル周波数ケプストラム係数は、機械学習の入力特徴として効果的な音声データを表現する方法です。これらは、スペクトログラムのスペクトル (「ケプストラム」) を取得し、人間の耳にはそれほど重要ではない高い周波数の一部を破棄することによって作成されます。音声認識の世界では長い歴史があり、https://en.wikipedia.org/wiki/Mel-frequency_cepstrum は詳細を学ぶのに良いリソースです。

ネストされたクラス

クラス製造オプションMfccのオプションの属性

定数

OP_NAME TensorFlow コア エンジンによって認識される、この演算の名前

パブリックメソッド

出力< TFloat32 >
asOutput ()
テンソルのシンボリック ハンドルを返します。
静的Mfcc
create (スコープscope、オペランド<TFloat32>スペクトログラム、オペランド<TInt32> sampleRate、オプション...オプション)
新しい Mfcc 操作をラップするクラスを作成するファクトリ メソッド。
静的Mfcc.Options
dctCoefficientCount (長い dctCoefficientCount)
静的Mfcc.Options
filterbankChannelCount (長いフィルターバンクチャンネル数)
静的Mfcc.Options
lowerFrequencyLimit (浮動小数点 lowerFrequencyLimit)
出力< TFloat32 >
静的Mfcc.Options
upperFrequencyLimit (浮動小数点上限周波数制限)

継承されたメソッド

定数

パブリック静的最終文字列OP_NAME

TensorFlow コア エンジンによって認識される、この演算の名前

定数値: "Mfcc"

パブリックメソッド

public Output < TFloat32 > asOutput ()

テンソルのシンボリック ハンドルを返します。

TensorFlow オペレーションへの入力は、別の TensorFlow オペレーションの出力です。このメソッドは、入力の計算を表すシンボリック ハンドルを取得するために使用されます。

public static Mfcc create (スコープスコープ、オペランド< TFloat32 > スペクトログラム、オペランド< TInt32 > sampleRate、オプション...オプション)

新しい Mfcc 操作をラップするクラスを作成するファクトリ メソッド。

パラメーター
範囲現在のスコープ
スペクトログラム通常は、magnitude_squared が true に設定された Spectrogram 演算によって生成されます。
サンプルレートソースオーディオが 1 秒あたりに使用したサンプル数。
オプションオプションの属性値を持ちます
戻り値
  • Mfcc の新しいインスタンス

public static Mfcc.Options dctCoefficientCount (Long dctCoefficientCount)

パラメーター
dct係数数タイム スライスごとに生成する出力チャネルの数。

public static Mfcc.Options filterbankChannelCount (Long filterbankChannelCount)

パラメーター
フィルターバンクチャンネル数内部で使用されるメルバンクの解像度。

public static Mfcc.Options lowerFrequencyLimit (Float lowerFrequencyLimit)

パラメーター
下限周波数制限セプストラムを計算するときに使用する最低周波数。

public出力< TFloat32 >出力()

public static Mfcc.Options upperFrequencyLimit (Float upperFrequencyLimit)

パラメーター
周波数上限セプストラムを計算するときに使用する最高周波数。