Skipgram

Skipgram de clase final pública

Analiza un archivo de texto y crea un lote de ejemplos.

Clases anidadas

clase Skipgram.Opciones Atributos opcionales para Skipgram

Métodos públicos

Skipgram estático
crear ( alcance de alcance, nombre de archivo de cadena, tamaño de lote largo, opciones ... opciones)
Método de fábrica para crear una clase que envuelva una nueva operación de Skipgram.
Salida <Entero>
currentEpoch ()
El número de época actual.
Salida <Entero>
ejemplos ()
Un vector de identificadores de palabras.
Salida <Entero>
etiquetas ()
Un vector de identificadores de palabras.
Skipgram estático .
minCount ( minCount largo)
Skipgram estático .
submuestra ( submuestra flotante)
Salida <Long>
totalWordsProcessed ()
El número total de palabras procesadas hasta el momento.
Salida <Entero>
vocabFreq ()
Frecuencias de palabras.
Salida <String>
vocabWord ()
Un vector de palabras en el corpus.
Skipgram estático .
Salida <Long>
wordsPerEpoch ()
Número de palabras por época en el archivo de datos.

Métodos heredados

Métodos públicos

creación de skipgram estático público ( alcance de alcance, nombre de archivo de cadena, tamaño de lote largo, opciones ... opciones)

Método de fábrica para crear una clase que envuelva una nueva operación de Skipgram.

Parámetros
alcance alcance actual
Nombre del archivo El nombre del archivo de texto del corpus.
tamaño del lote El tamaño del lote producido.
opciones lleva valores de atributos opcionales
Devoluciones
  • una nueva instancia de Skipgram

Salida pública <Integer> currentEpoch ()

El número de época actual.

ejemplos de salida pública <Intero> ()

Un vector de identificadores de palabras.

Etiquetas de salida pública <Intero> ()

Un vector de identificadores de palabras.

público estático Skipgram.Options minCount (Long minCount)

Parámetros
minCount El número mínimo de ocurrencias de palabras para que se incluyan en el vocabulario.

submuestra pública estática Skipgram.Options (submuestra flotante)

Parámetros
submuestra Umbral de ocurrencia de palabras. Las palabras que aparecen con mayor frecuencia se muestrearán aleatoriamente. Establecer en 0 para deshabilitar.

Salida pública <Long> totalWordsProcessed ()

El número total de palabras procesadas hasta el momento.

Salida pública <Integer> vocabFreq ()

Frecuencias de palabras. Clasificados en orden no ascendente.

Salida pública <String> vocabWord ()

Un vector de palabras en el corpus.

public static Skipgram.Options windowSize (Long windowSize)

Parámetros
tamaño de ventana El número de palabras para predecir a la izquierda y derecha del objetivo.

salida pública <Long> wordsPerEpoch ()

Número de palabras por época en el archivo de datos.