パブリック最終クラスStringNGrams
不規則な文字列データから ngram を作成します。
この演算は、文字列のみを含む 1 つの不規則な次元を持つ不規則なテンソルを受け入れ、その文字列の ngram を含む 1 つの不規則な次元を持つ不規則なテンソルを、最も内側の軸に沿って結合して出力します。
パブリックメソッド
static <T extends Number> StringNGrams <T> | |
出力<文字列> | ングラム() 出力 ngram の値テンソルは不規則なテンソルです。 |
出力<T> | ngramsSplits () 出力 ngram の分割テンソルは不規則なテンソルです。 |
継承されたメソッド
パブリックメソッド
public static StringNGrams <T> create (スコープスコープ、オペランド<String> データ、オペランド<T> dataSplits、文字列セパレータ、List<Long> ngramWidths、String leftPad、String rightPad、Long PadWidth、Boolean prepareShortSequences)
新しい StringNGrams オペレーションをラップするクラスを作成するファクトリ メソッド。
パラメーター
範囲 | 現在のスコープ |
---|---|
データ | ngram を作成する不規則な文字列テンソルの値テンソル。 1D 文字列テンソルである必要があります。 |
データ分割 | ngram を作成する不規則な文字列テンソルの分割テンソル。 |
セパレーター | トークンの要素間に追加する文字列。区切り文字を使用しない場合は「」を使用します。 |
ngramWidths | 作成する ngram のサイズ。 |
左パッド | ngram シーケンスの左側をパディングするために使用する文字列。 Pad_width != 0 の場合にのみ使用されます。 |
右パッド | ngram シーケンスの右側をパディングするために使用する文字列。 Pad_width != 0 の場合にのみ使用されます。 |
パッド幅 | 各シーケンスの両側に追加するパディング要素の数。この値に関係なく、パディングが「ngram_widths」-1 より大きくなることはないことに注意してください。 `pad_width=-1` の場合、`max(ngram_widths)-1` 要素を追加します。 |
戻り値
- StringNGrams の新しいインスタンス