スキップグラム

公開最終クラススキップグラム

テキスト ファイルを解析し、サンプルのバッチを作成します。

ネストされたクラス

クラススキップグラムのオプションSkipgramのオプションの属性

パブリックメソッド

静的スキップグラム
create (スコープスコープ、文字列ファイル名、長いバッチサイズ、オプション...オプション)
新しい Skipgram オペレーションをラップするクラスを作成するためのファクトリ メソッド。
出力<整数>
currentEpoch ()
現在のエポック番号。
出力<整数>
()
単語 ID のベクトル。
出力<整数>
ラベル()
単語 ID のベクトル。
静的Skipgram.Options
minCount (長い minCount)
静的Skipgram.Options
サブサンプル(Float サブサンプル)
出力<ロング>
totalWordsProcessed ()
これまでに処理された単語の合計数。
出力<整数>
語彙頻度()
単語の頻度。
出力<文字列>
語彙ワード()
コーパス内の単語のベクトル。
静的Skipgram.Options
windowSize (長いウィンドウサイズ)
出力<ロング>
エポックごとの単語()
データ ファイル内のエポックごとのワード数。

継承されたメソッド

パブリックメソッド

public static Skipgram create (スコープスコープ、文字列ファイル名、ロングバッチサイズ、オプション...オプション)

新しい Skipgram オペレーションをラップするクラスを作成するためのファクトリ メソッド。

パラメーター
範囲現在のスコープ
ファイル名コーパスのテキスト ファイル名。
バッチサイズ生産されたバッチのサイズ。
オプションオプションの属性値を持ちます
戻り値
  • Skipgram の新しいインスタンス

public Output <整数> currentEpoch ()

現在のエポック番号。

public出力<Integer> の()

単語 ID のベクトル。

public出力<Integer>ラベル()

単語 ID のベクトル。

public static Skipgram.Options minCount (Long minCount)

パラメーター
分数語彙に含まれる単語の最小出現数。

public static Skipgram.Optionsサブサンプル(Float サブサンプル)

パラメーター
サブサンプル単語の出現のしきい値。より高い頻度で出現する単語はランダムにダウンサンプリングされます。無効にするには 0 に設定します。

public出力<Long> totalWordsProcessed ()

これまでに処理された単語の合計数。

public Output <整数> vocabFreq ()

単語の頻度。非昇順で並べ替えられます。

public出力<String> vocabWord ()

コーパス内の単語のベクトル。

public static Skipgram.Options windowSize (Long windowSize)

パラメーター
ウィンドウサイズターゲットの左右に予測する単語の数。

public Output <Long> WordsPerEpoch ()

データ ファイル内のエポックごとのワード数。