Skipgram

aula final pública Skipgram

Analisa um arquivo de texto e cria um lote de exemplos.

Classes aninhadas

aula Skipgram.Options Atributos opcionais para Skipgram

Métodos públicos

Skipgram estático
create ( escopo do escopo, nome do arquivo String, tamanho do lote longo, opções... opções)
Método de fábrica para criar uma classe envolvendo uma nova operação Skipgram.
Saída <Inteiro>
atualEpoch ()
O número da época atual.
Saída <Inteiro>
exemplos ()
Um vetor de IDs de palavras.
Saída <Inteiro>
rótulos ()
Um vetor de IDs de palavras.
Skipgram estático.Opções
minCount (Long minCount)
Skipgram estático.Opções
subamostra (subamostra flutuante)
Saída <Long>
totalPalavrasProcessadas ()
O número total de palavras processadas até agora.
Saída <Inteiro>
vocabFreq ()
Frequências das palavras.
Saída <String>
vocabWord ()
Um vetor de palavras no corpus.
Skipgram estático.Opções
windowSize (long windowSize)
Saída <Long>
palavrasPerEpoch ()
Número de palavras por época no arquivo de dados.

Métodos Herdados

Métodos públicos

public static Skipgram create ( Escopo do escopo, String nome do arquivo, Long batchSize, Options... options)

Método de fábrica para criar uma classe envolvendo uma nova operação Skipgram.

Parâmetros
alcance escopo atual
nome do arquivo O nome do arquivo de texto do corpus.
tamanho do batch O tamanho do lote produzido.
opções carrega valores de atributos opcionais
Devoluções
  • uma nova instância do Skipgram

Public Output <Integer> currentEpoch ()

O número da época atual.

exemplos de saída pública <Integer> ()

Um vetor de IDs de palavras.

rótulos <Integer> de saída pública ()

Um vetor de IDs de palavras.

Public static Skipgram.Options minCount (Long minCount)

Parâmetros
minCount O número mínimo de ocorrências de palavras para que ela seja incluída no vocabulário.

subamostra de Skipgram.Options estática pública ( subamostra de flutuação)

Parâmetros
subamostra Limite para ocorrência de palavra. As palavras que aparecem com maior frequência serão reduzidas aleatoriamente. Defina como 0 para desabilitar.

Public Output <Long> totalWordsProcessed ()

O número total de palavras processadas até agora.

Public Output <Integer> vocabFreq ()

Frequências das palavras. Ordenado na ordem não crescente.

Public Output <String> vocabWord ()

Um vetor de palavras no corpus.

public static Skipgram.Options windowSize (Long windowSize)

Parâmetros
tamanho da janela O número de palavras para prever à esquerda e à direita do alvo.

Public Output <Long> wordsPerEpoch ()

Número de palavras por época no arquivo de dados.