Skipgram

public final class Skipgram

Analisa um arquivo de texto e cria um lote de exemplos.

Classes aninhadas

classe Skipgram.Options Atributos opcionais para Skipgram

Métodos Públicos

estática Skipgram
criar ( Scope escopo, String filename, Long BatchSize, Options ... Opções)
Método de fábrica para criar uma classe envolvendo uma nova operação Skipgram.
Output <Integer>
currentEpoch ()
O número da época atual.
Output <Integer>
exemplos ()
Um vetor de ids de palavras.
Output <Integer>
etiquetas ()
Um vetor de ids de palavras.
estáticos Skipgram.Options
mincount (Long mincount)
estáticos Skipgram.Options
subamostra (subamostra flutuador)
Output <longo>
totalWordsProcessed ()
O número total de palavras processadas até agora.
Output <Integer>
vocabFreq ()
Frequências de palavras.
Output <String>
vocabWord ()
Um vetor de palavras no corpus.
estáticos Skipgram.Options
windowSize (Long windowSize)
Output <longo>
wordsPerEpoch ()
Número de palavras por época no arquivo de dados.

Métodos herdados

Métodos Públicos

public static Skipgram criar ( Scope escopo, String filename, Long BatchSize, Options ... Opções)

Método de fábrica para criar uma classe envolvendo uma nova operação Skipgram.

Parâmetros
alcance escopo atual
nome do arquivo O nome do arquivo de texto do corpus.
tamanho do batch O tamanho do lote produzido.
opções carrega valores de atributos opcionais
Devoluções
  • uma nova instância de Skipgram

pública Output <Integer> currentEpoch ()

O número da época atual.

pública Output <Integer> exemplos ()

Um vetor de ids de palavras.

pública Output <Integer> etiquetas ()

Um vetor de ids de palavras.

public static Skipgram.Options mincount (Long mincount)

Parâmetros
minCount O número mínimo de ocorrências de palavras para que sejam incluídas no vocabulário.

public static Skipgram.Options subamostra (Float subamostra)

Parâmetros
subamostra Limiar para ocorrência de palavra. Palavras que aparecem com maior frequência serão amostradas aleatoriamente. Defina como 0 para desativar.

pública Output <longo> totalWordsProcessed ()

O número total de palavras processadas até agora.

pública Output <Integer> vocabFreq ()

Frequências de palavras. Classificado em ordem não crescente.

pública Output <String> vocabWord ()

Um vetor de palavras no corpus.

public static Skipgram.Options windowSize (Long windowSize)

Parâmetros
tamanho da janela O número de palavras a serem previstas à esquerda e à direita do alvo.

pública Output <longo> wordsPerEpoch ()

Número de palavras por época no arquivo de dados.