文字列Nグラム

パブリック最終クラスStringNGrams

不規則な文字列データから ngram を作成します。

この演算は、文字列のみを含む 1 つの不規則な次元を持つ不規則なテンソルを受け入れ、その文字列の ngram を含む 1 つの不規則な次元を持つ不規則なテンソルを、最も内側の軸に沿って結合して出力します。

パブリックメソッド

static <T extends Number> StringNGrams <T>
create (スコープスコープ、オペランド<String> データ、オペランド<T> dataSplits、文字列区切り文字、List<Long> ngramWidths、String leftPad、String rightPad、Long PadWidth、Boolean prepareShortSequences)
新しい StringNGrams オペレーションをラップするクラスを作成するファクトリ メソッド。
出力<文字列>
ングラム()
出力 ngram の値テンソルは不規則なテンソルです。
出力<T>
ngramsSplits ()
出力 ngram の分割テンソルは不規則なテンソルです。

継承されたメソッド

パブリックメソッド

public static StringNGrams <T> create (スコープスコープ、オペランド<String> データ、オペランド<T> dataSplits、文字列セパレータ、List<Long> ngramWidths、String leftPad、String rightPad、Long PadWidth、Boolean prepareShortSequences)

新しい StringNGrams オペレーションをラップするクラスを作成するファクトリ メソッド。

パラメーター
範囲現在のスコープ
データngram を作成する不規則な文字列テンソルの値テンソル。 1D 文字列テンソルである必要があります。
データ分割ngram を作成する不規則な文字列テンソルの分割テンソル。
セパレータートークンの要素間に追加する文字列。区切り文字を使用しない場合は「」を使用します。
ngramWidths作成する ngram のサイズ。
左パッドngram シーケンスの左側をパディングするために使用する文字列。 Pad_width != 0 の場合にのみ使用されます。
右パッドngram シーケンスの右側をパディングするために使用する文字列。 Pad_width != 0 の場合にのみ使用されます。
パッド幅各シーケンスの両側に追加するパディング要素の数。この値に関係なく、パディングが「ngram_widths」-1 より大きくなることはないことに注意してください。 `pad_width=-1` の場合、`max(ngram_widths)-1` 要素を追加します。
戻り値
  • StringNGrams の新しいインスタンス

public出力<String> ngrams ()

出力 ngram の値テンソルは不規則なテンソルです。

public Output <T> ngramsSplits ()

出力 ngram の分割テンソルは不規則なテンソルです。