Skipgram

aula final pública Skipgram

Analisa um arquivo de texto e cria um lote de exemplos.

Classes aninhadas

aula Skipgram.Options Atributos opcionais para Skipgram

Métodos Públicos

Skipgram estático
criar ( escopo do escopo, nome do arquivo da string, tamanho do lote longo, opções ... opções)
Método de fábrica para criar uma classe envolvendo uma nova operação Skipgram.
Saída <Integer>
currentEpoch ()
O número da época atual.
Saída <Integer>
exemplos ()
Um vetor de ids de palavras.
Saída <Integer>
rótulos ()
Um vetor de ids de palavras.
Skipgram.Options estático
minCount ( minCount longo)
Skipgram.Options estático
subamostra ( subamostra flutuante)
Saída <Long>
totalWordsProcessed ()
O número total de palavras processadas até agora.
Saída <Integer>
vocabFreq ()
Frequências de palavras.
Saída <>
vocabWord ()
Um vetor de palavras no corpus.
Skipgram.Options estático
windowSize (Long windowSize)
Saída <Long>
wordsPerEpoch ()
Número de palavras por época no arquivo de dados.

Métodos herdados

Métodos Públicos

public static Skipgram create ( escopo de escopo, nome de arquivo de string, long batchSize, opções ... opções)

Método de fábrica para criar uma classe envolvendo uma nova operação Skipgram.

Parâmetros
alcance escopo atual
nome do arquivo O nome do arquivo de texto do corpus.
tamanho do batch O tamanho do lote produzido.
opções carrega valores de atributos opcionais
Devoluções
  • uma nova instância de Skipgram

Saída pública <Integer> currentEpoch ()

O número da época atual.

exemplos public Output <Integer> ()

Um vetor de ids de palavras.

rótulos public Output <Integer> ()

Um vetor de ids de palavras.

public static Skipgram.Options minCount (Long minCount)

Parâmetros
minCount O número mínimo de ocorrências de palavras para que sejam incluídas no vocabulário.

public static Skipgram.Options subamostra (Float subamostra)

Parâmetros
subamostra Limiar para ocorrência de palavra. Palavras que aparecem com maior frequência serão amostradas aleatoriamente. Defina como 0 para desativar.

public Output <Long> totalWordsProcessed ()

O número total de palavras processadas até agora.

public Output <Integer> vocabFreq ()

Frequências de palavras. Classificado em ordem não crescente.

Saída pública <String> vocabWord ()

Um vetor de palavras no corpus.

public static Skipgram.Options windowSize (Long windowSize)

Parâmetros
tamanho da janela O número de palavras a serem previstas à esquerda e à direita do alvo.

public Output <Long> wordsPerEpoch ()

Número de palavras por época no arquivo de dados.