Skipgram

Skigram della classe finale pubblica

Analizza un file di testo e crea una serie di esempi.

Classi nidificate

classe Skipgram.Opzioni Attributi facoltativi per Skipgram

Metodi pubblici

Skipgram statico
crea (ambito ambito , nome file stringa, dimensione batch lunga, opzioni... opzioni)
Metodo factory per creare una classe che racchiude una nuova operazione Skipgram.
Output <Intero>
epoca corrente ()
Il numero dell'epoca corrente.
Output <Intero>
esempi ()
Un vettore di ID di parole.
Output <Intero>
etichette ()
Un vettore di ID di parole.
Skipgram.Options statico
minCount (Conteggio min lungo)
Skipgram.Options statico
sottocampione (sottocampione Float)
Uscita <Lungo>
parole totali elaborate ()
Il numero totale di parole elaborate finora.
Output <Intero>
vocabFreq ()
Frequenze delle parole.
Uscita <Stringa>
vocabolario ()
Un vettore di parole nel corpus.
Skipgram.Options statico
dimensione finestra (dimensione finestra lunga)
Uscita <Lungo>
parolePerEpoca ()
Numero di parole per epoca nel file di dati.

Metodi ereditati

Metodi pubblici

Creazione Skipgram pubblica statica (ambito ambito , nome file stringa, dimensione batch lunga, opzioni... opzioni)

Metodo factory per creare una classe che racchiude una nuova operazione Skipgram.

Parametri
scopo ambito attuale
nome del file Il nome del file di testo del corpus.
dimensione del lotto La dimensione del lotto prodotto.
opzioni trasporta valori di attributi opzionali
ritorna
  • una nuova istanza di Skipgram

output pubblico <Integer> currentEpoch ()

Il numero dell'epoca corrente.

public Output <Integer> esempi ()

Un vettore di ID di parole.

Etichette <numero intero> di output pubblico ()

Un vettore di ID di parole.

pubblico statico Skipgram.Options minCount (Long minCount)

Parametri
minCount Il numero minimo di occorrenze della parola affinché possa essere inclusa nel vocabolario.

sottocampione pubblico statico Skipgram.Options (sottocampione Float)

Parametri
sottocampione Soglia per l'occorrenza della parola. Le parole che appaiono con maggiore frequenza verranno sottocampionate in modo casuale. Impostare su 0 per disabilitare.

Output pubblico <Long> totalWordsProcessed ()

Il numero totale di parole elaborate finora.

output pubblico <intero> vocabFreq ()

Frequenze delle parole. Ordinati in ordine non crescente.

output pubblico <String> vocabWord ()

Un vettore di parole nel corpus.

public static Skipgram.Options windowSize (Long windowSize)

Parametri
windowSize Il numero di parole da prevedere a sinistra e a destra del target.

output pubblico <Long> parolePerEpoch ()

Numero di parole per epoca nel file di dati.