Skipgram

публичный финальный класс Skipgram

Анализирует текстовый файл и создает пакет примеров.

Вложенные классы

сорт Скипграмма.Опции Дополнительные атрибуты для Skipgram

Публичные методы

статическая скипграмма
create ( Область действия, Строковое имя файла, Длинный размер пакета, Параметры... параметры)
Фабричный метод для создания класса, обертывающего новую операцию Skipgram.
Вывод <Целое число>
текущая эпоха ()
Текущий номер эпохи.
Вывод <Целое число>
Примеры ()
Вектор идентификаторов слов.
Вывод <Целое число>
этикетки ()
Вектор идентификаторов слов.
статический Skipgram.Options
minCount (длинный minCount)
статический Skipgram.Options
подвыборка (подвыборка с плавающей запятой)
Вывод <Длинный>
всего словобработано ()
Общее количество слов, обработанных на данный момент.
Вывод <Целое число>
вокалчастота ()
Частоты слов.
Вывод <Строка>
словарное слово ()
Вектор слов в корпусе.
статический Skipgram.Options
windowSize (длинный размер окна)
Вывод <Длинный>
словаЗаЭпоху ()
Количество слов за эпоху в файле данных.

Унаследованные методы

Публичные методы

общедоступное статическое создание Skipgram (область действия , строковое имя файла, длинный пакетный размер, параметры... параметры)

Фабричный метод для создания класса, обертывающего новую операцию Skipgram.

Параметры
объем текущий объем
имя файла Имя текстового файла корпуса.
размер партии Размер выпускаемой партии.
параметры содержит значения необязательных атрибутов
Возврат
  • новый экземпляр Skipgram

публичный вывод <Integer> currentEpoch ()

Текущий номер эпохи.

Примеры публичного вывода <Integer> ()

Вектор идентификаторов слов.

публичные метки вывода <Integer> ()

Вектор идентификаторов слов.

общедоступный статический Skipgram.Options minCount (Long minCount)

Параметры
minCount Минимальное количество вхождений слова, чтобы оно было включено в словарь.

общедоступная статическая подвыборка Skipgram.Options (подвыборка с плавающей запятой)

Параметры
подвыборка Порог появления слова. Слова, которые появляются с большей частотой, будут случайным образом сокращены. Установите значение 0, чтобы отключить.

публичный вывод <Long> totalWordsProcessed ()

Общее количество слов, обработанных на данный момент.

публичный вывод <Integer> vocabFreq ()

Частоты слов. Отсортировано в порядке невозрастания.

публичный вывод <String> vocabWord ()

Вектор слов в корпусе.

общедоступный статический Skipgram.Options windowSize (длинный размер окна)

Параметры
размер окна Количество слов для прогнозирования слева и справа от цели.

публичный вывод <Long> wordsPerEpoch ()

Количество слов за эпоху в файле данных.