Aprenda o que há de mais recente em aprendizado de máquina, IA generativa e muito mais no WiML Symposium 2023
Registre-se
StringNGrams
Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
Cria ngrams de dados de string irregulares.
Este op aceita um tensor irregular com 1 dimensão irregular contendo apenas strings e gera um tensor irregular com 1 dimensão irregular contendo ngrams dessa string, unidos ao longo do eixo mais interno.
Métodos públicos
| estático <T estende o número> StringNGrams <T> | create ( Escopo do escopo, Operando <String> dados, Operando <T> dataSplits, Separador de strings, List<Long> ngramWidths, String leftPad, String rightPad, Long padWidth, Boolean preserveShortSequences) Método de fábrica para criar uma classe envolvendo uma nova operação StringNGrams. |
| Saída <String> | nggramas () O tensor de valores do tensor irregular de ngrams de saída. |
| Saída <T> | ngramsSplits () O tensor de divisões do tensor irregular de ngrams de saída. |
Métodos Herdados
Da classe java.lang.Object | boleano | igual a (objeto arg0) |
| Aula final<?> | getClass () |
| int | código de hash () |
| vazio final | notifique () |
| vazio final | notifiqueTodos () |
| Fragmento | toString () |
| vazio final | espere (long arg0, int arg1) |
| vazio final | espere (arg0 longo) |
| vazio final | espere () |
Métodos públicos
public static StringNGrams <T> create ( Escopo do escopo, Operando <String> dados, Operando <T> dataSplits, Separador de strings, List<Long> ngramWidths, String leftPad, String rightPad, Long padWidth, Boolean preserveShortSequences)
Método de fábrica para criar uma classe envolvendo uma nova operação StringNGrams.
Parâmetros
| alcance | escopo atual |
|---|
| dados | O tensor de valores do tensor de string irregular para fazer ngrams. Deve ser um tensor de string 1D. |
|---|
| DataSplits | O tensor de divisão do tensor de corda irregular para fazer ngrams. |
|---|
| separador | A string a ser acrescentada entre os elementos do token. Use "" para nenhum separador. |
|---|
| ngramWidths | Os tamanhos dos ngrams a serem criados. |
|---|
| teclado esquerdo | A string a ser usada para preencher o lado esquerdo da sequência ngram. Usado apenas se pad_width != 0. |
|---|
| teclado direito | A string a ser usada para preencher o lado direito da sequência ngram. Usado apenas se pad_width != 0. |
|---|
| padWidth | O número de elementos de preenchimento a serem adicionados a cada lado de cada sequência. Observe que o preenchimento nunca será maior que 'ngram_widths'-1, independentemente desse valor. Se `pad_width=-1`, adicione os elementos `max(ngram_widths)-1`. |
|---|
Devoluções
- uma nova instância de StringNGrams
Public Output <String> ngrams ()
O tensor de valores do tensor irregular de ngrams de saída.
Public Output <T> ngramsSplits ()
O tensor de divisões do tensor irregular de ngrams de saída.
Exceto no caso de indicação contrária, o conteúdo desta página é licenciado de acordo com a Licença de atribuição 4.0 do Creative Commons, e as amostras de código são licenciadas de acordo com a Licença Apache 2.0. Para mais detalhes, consulte as políticas do site do Google Developers. Java é uma marca registrada da Oracle e/ou afiliadas. Alguns conteúdos são licenciados com a licença numpy.
Última atualização 2022-05-17 UTC.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Não contém as informações de que eu preciso","missingTheInformationINeed","thumb-down"],["Muito complicado / etapas demais","tooComplicatedTooManySteps","thumb-down"],["Desatualizado","outOfDate","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Problema com as amostras / o código","samplesCodeIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2022-05-17 UTC."],[],[]]