Skipgram

aula final pública Skipgram

Analisa um arquivo de texto e cria um lote de exemplos.

Classes aninhadas

aula Skipgram.Opções Atributos opcionais para Skipgram

Métodos Públicos

Skipgram estático
create ( Escopo do escopo , String nome do arquivo, Long batchSize, Opções... opções)
Método de fábrica para criar uma classe que envolve uma nova operação Skipgram.
Saída <Inteiro>
época atual ()
O número da época atual.
Saída <Inteiro>
exemplos ()
Um vetor de IDs de palavras.
Saída <Inteiro>
rótulos ()
Um vetor de IDs de palavras.
Skipgram.Options estático
minCount (minCount longo)
Skipgram.Options estático
subamostra (subamostra flutuante)
Saída <Longa>
totalPalavrasProcessadas ()
O número total de palavras processadas até agora.
Saída <Inteiro>
vocabulárioFreq ()
Frequências de palavras.
Saída <String>
vocabulárioPalavra ()
Um vetor de palavras no corpus.
Skipgram.Options estático
windowSize (janela longa)
Saída <Longa>
palavrasPorÉpoca ()
Número de palavras por época no arquivo de dados.

Métodos herdados

Métodos Públicos

public static Skipgram create ( Escopo do escopo , String nome do arquivo, Long batchSize, Opções... opções)

Método de fábrica para criar uma classe que envolve uma nova operação Skipgram.

Parâmetros
escopo escopo atual
nome do arquivo O nome do arquivo de texto do corpus.
tamanho do batch O tamanho do lote produzido.
opções carrega valores de atributos opcionais
Devoluções
  • uma nova instância do Skipgram

Saída pública <Integer> currentEpoch ()

O número da época atual.

exemplos de saída pública <inteiro> ()

Um vetor de IDs de palavras.

rótulos de saída pública <inteiro> ()

Um vetor de IDs de palavras.

público estático Skipgram.Options minCount (Long minCount)

Parâmetros
contagem mínima O número mínimo de ocorrências de palavras para que ela seja incluída no vocabulário.

subamostra pública estática Skipgram.Options (subamostra flutuante)

Parâmetros
subamostra Limite para ocorrência de palavras. Palavras que aparecem com maior frequência serão amostradas aleatoriamente. Defina como 0 para desativar.

Saída pública <Long> totalWordsProcessed ()

O número total de palavras processadas até agora.

Saída pública <Inteiro> vocabFreq ()

Frequências de palavras. Classificado em ordem não crescente.

Saída pública <String> vocabWord ()

Um vetor de palavras no corpus.

público estático Skipgram.Options windowSize (longo windowSize)

Parâmetros
tamanho da janela O número de palavras a serem previstas à esquerda e à direita do alvo.

Saída pública <Long> palavrasPerEpoch ()

Número de palavras por época no arquivo de dados.