パブリックファイナルクラスStringNGrams
不規則な文字列データからngramを作成します。
この演算は、文字列のみを含む1つの不規則な次元を持つ不規則テンソルを受け入れ、最も内側の軸に沿って結合された、その文字列のngramを含む1つの不規則な次元を持つ不規則なテンソルを出力します。
パブリックメソッド
static <T extends Number> StringNGrams <T> | |
出力<文字列> | ngrams () 出力ngramsの値テンソルは不規則なテンソルです。 |
出力<T> | ngramsSplits () 出力ngramの分割テンソルは不規則なテンソルです。 |
継承されたメソッド
パブリックメソッド
public static StringNGrams <T> create (スコープスコープ、オペランド<文字列>データ、オペランド<T> dataSplits、文字列セパレータ、リスト<Long> ngramWidths、文字列leftPad、文字列rightPad、Long padWidth、ブールpreserveShortSequences)
新しいStringNGrams操作をラップするクラスを作成するファクトリメソッド。
パラメーター
範囲 | 現在のスコープ |
---|---|
データ | ngramを作成するための不規則な文字列テンソルの値テンソル。 1D文字列テンソルである必要があります。 |
dataSplits | ngramを作成するための不規則な文字列テンソルの分割テンソル。 |
セパレーター | トークンの要素間に追加する文字列。区切り文字がない場合は「」を使用します。 |
ngramWidths | 作成するngramのサイズ。 |
leftPad | ngramシーケンスの左側を埋めるために使用する文字列。 pad_width!= 0の場合にのみ使用されます。 |
rightPad | ngramシーケンスの右側を埋めるために使用する文字列。 pad_width!= 0の場合にのみ使用されます。 |
padWidth | 各シーケンスの両側に追加するパディング要素の数。この値に関係なく、パディングが 'ngram_widths'-1より大きくなることはないことに注意してください。 `pad_width = -1`の場合、` max(ngram_widths)-1`要素を追加します。 |
戻り値
- StringNGramsの新しいインスタンス