Skipgram

clase final pública Skipgram

Analiza un archivo de texto y crea un lote de ejemplos.

Clases anidadas

clase Saltargram.Opciones Atributos opcionales para Skipgram

Métodos públicos

Saltargrama estático
crear ( alcance alcance , nombre de archivo de cadena, tamaño de lote largo, opciones... opciones)
Método de fábrica para crear una clase que envuelve una nueva operación Skipgram.
Salida <Entero>
época actual ()
El número de época actual.
Salida <Entero>
ejemplos ()
Un vector de identificadores de palabras.
Salida <Entero>
etiquetas ()
Un vector de identificadores de palabras.
Opciones estáticas de Skipgram
minCount (largo minCount)
Opciones estáticas de Skipgram
submuestra (submuestra flotante)
Salida <Larga>
palabras totales procesadas ()
El número total de palabras procesadas hasta el momento.
Salida <Entero>
frecuencia de vocabulario ()
Frecuencias de palabras.
Salida <Cadena>
palabravocab ()
Un vector de palabras en el corpus.
Opciones estáticas de Skipgram
Tamaño de ventana (Tamaño de ventana largo)
Salida <Larga>
palabras por época ()
Número de palabras por época en el archivo de datos.

Métodos heredados

Métodos públicos

Creación de Skipgram estática pública ( alcance , nombre de archivo de cadena, tamaño de lote largo, opciones... opciones)

Método de fábrica para crear una clase que envuelve una nueva operación Skipgram.

Parámetros
alcance alcance actual
Nombre del archivo El nombre del archivo de texto del corpus.
tamaño del lote El tamaño del lote producido.
opciones lleva valores de atributos opcionales
Devoluciones
  • una nueva instancia de Skipgram

Salida pública <Entero> currentEpoch ()

El número de época actual.

ejemplos de salida pública <entero> ()

Un vector de identificadores de palabras.

Etiquetas públicas de salida <Entero> ()

Un vector de identificadores de palabras.

Skipgram.Options estático público minCount (Long minCount)

Parámetros
cuentamin El número mínimo de apariciones de palabras para que se incluya en el vocabulario.

submuestra pública estática Skipgram.Options (submuestra flotante)

Parámetros
submuestra Umbral de aparición de palabras. Las palabras que aparecen con mayor frecuencia se reducirán aleatoriamente. Establezca en 0 para desactivar.

Salida pública <Long> totalWordsProcessed ()

El número total de palabras procesadas hasta el momento.

Salida pública <Entero> vocabFreq ()

Frecuencias de palabras. Ordenado en orden no ascendente.

Salida pública <Cadena> palabravocab ()

Un vector de palabras en el corpus.

Skipgram.Options estático público tamaño de ventana (tamaño de ventana largo)

Parámetros
tamaño de ventana El número de palabras a predecir a la izquierda y a la derecha del objetivo.

Salida pública <Larga> palabrasPorEpoch ()

Número de palabras por época en el archivo de datos.