Skipgram

Clase public final Skipgram

Analiza un archivo de texto y crea un lote de ejemplos.

Clases anidadas

clase Skipgram.Options Los atributos opcionales para Skipgram

Métodos públicos

estática Skipgram
crear ( Alcance alcance, la cadena de nombre de archivo, Long batchSize, Opciones ... Opciones)
Método de fábrica para crear una clase que envuelva una nueva operación de Skipgram.
Salida <Integer>
currentEpoch ()
El número de época actual.
Salida <Integer>
ejemplos ()
Un vector de identificadores de palabras.
Salida <Integer>
etiquetas ()
Un vector de identificadores de palabras.
estáticas Skipgram.Options
minCount (Long minCount)
estáticas Skipgram.Options
submuestra (submuestra Float)
Salida <Larga>
totalWordsProcessed ()
El número total de palabras procesadas hasta el momento.
Salida <Integer>
vocabFreq ()
Frecuencias de palabras.
Salida <String>
vocabWord ()
Un vector de palabras en el corpus.
estáticas Skipgram.Options
windowSize (Long windowSize)
Salida <Larga>
wordsPerEpoch ()
Número de palabras por época en el archivo de datos.

Métodos heredados

Métodos públicos

public static Skipgram crear ( Alcance alcance, la cadena de nombre de archivo, Long batchSize, Opciones ... Opciones)

Método de fábrica para crear una clase que envuelva una nueva operación de Skipgram.

Parámetros
alcance alcance actual
nombre del archivo El nombre del archivo de texto del corpus.
tamaño del lote El tamaño del lote producido.
opciones lleva valores de atributos opcionales
Devoluciones
  • una nueva instancia de Skipgram

pública de salida <Integer> currentEpoch ()

El número de época actual.

pública de salida <Integer> ejemplos ()

Un vector de identificadores de palabras.

pública de salida <Integer> etiquetas ()

Un vector de identificadores de palabras.

public static Skipgram.Options minCount (Long minCount)

Parámetros
minCount El número mínimo de ocurrencias de palabras para que se incluyan en el vocabulario.

public static Skipgram.Options submuestra (Float submuestra)

Parámetros
submuestra Umbral de ocurrencia de palabras. Las palabras que aparecen con mayor frecuencia se muestrearán aleatoriamente. Establecer en 0 para deshabilitar.

pública de salida <Larga> totalWordsProcessed ()

El número total de palabras procesadas hasta el momento.

pública de salida <Integer> vocabFreq ()

Frecuencias de palabras. Clasificados en orden no ascendente.

pública de salida <String> vocabWord ()

Un vector de palabras en el corpus.

public static Skipgram.Options windowSize (Long windowSize)

Parámetros
tamaño de ventana El número de palabras para predecir a la izquierda y derecha del objetivo.

pública de salida <Larga> wordsPerEpoch ()

Número de palabras por época en el archivo de datos.