StringNGrams

classe final pública StringNGrams

Cria ngrams de dados de string irregulares.

Este op aceita um tensor irregular com 1 dimensão irregular contendo apenas strings e gera um tensor irregular com 1 dimensão irregular contendo ngrams dessa string, unidos ao longo do eixo mais interno.

Métodos públicos

estático <T estende o número> StringNGrams <T>
create ( Escopo do escopo, Operando <String> dados, Operando <T> dataSplits, Separador de strings, List<Long> ngramWidths, String leftPad, String rightPad, Long padWidth, Boolean preserveShortSequences)
Método de fábrica para criar uma classe envolvendo uma nova operação StringNGrams.
Saída <String>
nggramas ()
O tensor de valores do tensor irregular de ngrams de saída.
Saída <T>
ngramsSplits ()
O tensor de divisões do tensor irregular de ngrams de saída.

Métodos Herdados

Métodos públicos

public static StringNGrams <T> create ( Escopo do escopo, Operando <String> dados, Operando <T> dataSplits, Separador de strings, List<Long> ngramWidths, String leftPad, String rightPad, Long padWidth, Boolean preserveShortSequences)

Método de fábrica para criar uma classe envolvendo uma nova operação StringNGrams.

Parâmetros
alcance escopo atual
dados O tensor de valores do tensor de string irregular para fazer ngrams. Deve ser um tensor de string 1D.
DataSplits O tensor de divisão do tensor de corda irregular para fazer ngrams.
separador A string a ser acrescentada entre os elementos do token. Use "" para nenhum separador.
ngramWidths Os tamanhos dos ngrams a serem criados.
teclado esquerdo A string a ser usada para preencher o lado esquerdo da sequência ngram. Usado apenas se pad_width != 0.
teclado direito A string a ser usada para preencher o lado direito da sequência ngram. Usado apenas se pad_width != 0.
padWidth O número de elementos de preenchimento a serem adicionados a cada lado de cada sequência. Observe que o preenchimento nunca será maior que 'ngram_widths'-1, independentemente desse valor. Se `pad_width=-1`, adicione os elementos `max(ngram_widths)-1`.
Devoluções
  • uma nova instância de StringNGrams

Public Output <String> ngrams ()

O tensor de valores do tensor irregular de ngrams de saída.

Public Output <T> ngramsSplits ()

O tensor de divisões do tensor irregular de ngrams de saída.