Skipgram

clase final pública Skipgram

Analiza un archivo de texto y crea un lote de ejemplos.

Clases anidadas

clase Skipgram.Opciones Atributos opcionales para Skipgram

Métodos públicos

Skipgrama estático
crear ( Ámbito de alcance, Nombre de archivo de cadena, Tamaño de lote largo, Opciones... opciones)
Método de fábrica para crear una clase que envuelve una nueva operación de Skipgram.
Salida <Entero>
época actual ()
El número de época actual.
Salida <Entero>
ejemplos ()
Un vector de identificadores de palabras.
Salida <Entero>
etiquetas ()
Un vector de identificadores de palabras.
Skipgram estático.Opciones
minCount (Largo minCount)
Skipgram estático.Opciones
submuestra (submuestra flotante)
Salida <Largo>
totalPalabrasProcesadas ()
El número total de palabras procesadas hasta el momento.
Salida <Entero>
frecuencia de vocabulario ()
Frecuencias de palabras.
Salida <Cadena>
palabra de vocabulario ()
Un vector de palabras en el corpus.
Skipgram estático.Opciones
tamaño de ventana (Tamaño de ventana largo)
Salida <Largo>
palabras por época ()
Número de palabras por época en el archivo de datos.

Métodos Heredados

Métodos públicos

Skipgram estático público crear ( Ámbito de alcance, Nombre de archivo de cadena, Tamaño de lote largo, Opciones... opciones)

Método de fábrica para crear una clase que envuelve una nueva operación de Skipgram.

Parámetros
alcance alcance actual
nombre del archivo El nombre del archivo de texto del corpus.
tamaño del lote El tamaño del lote producido.
opciones lleva valores de atributos opcionales
Devoluciones
  • una nueva instancia de Skipgram

Salida pública <Integer> currentEpoch ()

El número de época actual.

Ejemplos de salida pública <Integer> ()

Un vector de identificadores de palabras.

Salida pública <Entero> etiquetas ()

Un vector de identificadores de palabras.

público estático Skipgram.Options minCount (long minCount)

Parámetros
minCount El número mínimo de ocurrencias de palabras para que se incluya en el vocabulario.

submuestra pública estática de Skipgram.Options ( submuestra flotante)

Parámetros
submuestra Umbral de ocurrencia de palabras. Las palabras que aparecen con mayor frecuencia se reducirán aleatoriamente. Establecer en 0 para deshabilitar.

Salida pública <Long> totalWordsProcessed ()

El número total de palabras procesadas hasta el momento.

Salida pública <Entero> vocabFreq ()

Frecuencias de palabras. Ordenados en orden no ascendente.

Salida pública <String> vocabWord ()

Un vector de palabras en el corpus.

Skipgram público estático. Opciones de tamaño de ventana (Tamaño de ventana largo)

Parámetros
tamaño de ventana El número de palabras para predecir a la izquierda y derecha del objetivo.

salida pública <Long> palabras por época ()

Número de palabras por época en el archivo de datos.