Skipgram

publiczny Skipgram klasy końcowej

Analizuje plik tekstowy i tworzy partię przykładów.

Klasy zagnieżdżone

klasa Opcje pomijania Opcjonalne atrybuty Skipgram

Metody publiczne

statyczny Skipgram
utwórz (zakres zakresu , nazwa pliku ciągu, długi rozmiar wsadu, opcje... opcje)
Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację Skipgram.
Wyjście <liczba całkowita>
bieżąca epoka ()
Numer aktualnej epoki.
Wyjście <liczba całkowita>
przykłady ()
Wektor identyfikatorów słów.
Wyjście <liczba całkowita>
etykiety ()
Wektor identyfikatorów słów.
statyczny Skipgram.Opcje
minCount (Długie minCount)
statyczny Skipgram.Opcje
podpróbka (podpróbka pływająca)
Wyjście <Długie>
łącznieSłowaPrzetworzone ()
Całkowita liczba słów przetworzonych do tej pory.
Wyjście <liczba całkowita>
słownictwoCzęstotliwość ()
Częstotliwości słów.
Wyjście <Ciąg>
słownictwoSłowo ()
Wektor słów w korpusie.
statyczny Skipgram.Opcje
Rozmiar okna (Długi rozmiar okna)
Wyjście <Długie>
słowa na epokę ()
Liczba słów na epokę w pliku danych.

Metody dziedziczone

Metody publiczne

public static Skipgram create (zakres zakresu , nazwa pliku ciągu, długi rozmiar wsadu, opcje... opcje)

Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację Skipgram.

Parametry
zakres aktualny zakres
Nazwa pliku Nazwa pliku tekstowego korpusu.
Rozmiar partii Wielkość produkowanej partii.
opcje przenosi opcjonalne wartości atrybutów
Zwroty
  • nowa instancja Skipgramu

public Output <Integer> currentEpoch ()

Numer aktualnej epoki.

public Output <Integer> przykłady ()

Wektor identyfikatorów słów.

publiczne etykiety wyjściowe <Integer> ()

Wektor identyfikatorów słów.

publiczny statyczny Skipgram.Options minCount (Long minCount)

Parametry
minIl Minimalna liczba wystąpień wyrazu, aby słowo znalazło się w słowniku.

public static Podpróbka Skipgram.Options (podpróbka Float)

Parametry
podpróbka Próg wystąpienia słowa. Słowa pojawiające się z większą częstotliwością zostaną losowo zmniejszone. Ustaw na 0, aby wyłączyć.

publiczne wyjście <Long> totalWordsProcessed ()

Całkowita liczba słów przetworzonych do tej pory.

publiczne wyjście <Integer> vocabFreq ()

Częstotliwości słów. Posortowane w kolejności nierosnącej.

publiczne wyjście <String> vocabWord ()

Wektor słów w korpusie.

publiczny statyczny Skipgram.Options rozmiar okna (długi rozmiar okna)

Parametry
rozmiar okna Liczba słów do przewidzenia po lewej i prawej stronie elementu docelowego.

publiczne wyjście <Long> słów na epokę ()

Liczba słów na epokę w pliku danych.