Skipgram de clase final pública
Analiza un archivo de texto y crea un lote de ejemplos.
Clases anidadas
| clase | Skipgram.Opciones | Atributos opcionales para Skipgram | |
Métodos públicos
| Skipgram estático | crear ( alcance de alcance, nombre de archivo de cadena, tamaño de lote largo, opciones ... opciones) Método de fábrica para crear una clase que envuelva una nueva operación de Skipgram. |
| Salida <Entero> | currentEpoch () El número de época actual. |
| Salida <Entero> | ejemplos () Un vector de identificadores de palabras. |
| Salida <Entero> | etiquetas () Un vector de identificadores de palabras. |
| Skipgram estático . | |
| Skipgram estático . | submuestra ( submuestra flotante) |
| Salida <Long> | totalWordsProcessed () El número total de palabras procesadas hasta el momento. |
| Salida <Entero> | vocabFreq () Frecuencias de palabras. |
| Salida <String> | vocabWord () Un vector de palabras en el corpus. |
| Skipgram estático . | windowSize ( tamaño de ventana largo) |
| Salida <Long> | wordsPerEpoch () Número de palabras por época en el archivo de datos. |
Métodos heredados
Métodos públicos
creación de skipgram estático público ( alcance de alcance, nombre de archivo de cadena, tamaño de lote largo, opciones ... opciones)
Método de fábrica para crear una clase que envuelva una nueva operación de Skipgram.
Parámetros
| alcance | alcance actual |
|---|---|
| Nombre del archivo | El nombre del archivo de texto del corpus. |
| tamaño del lote | El tamaño del lote producido. |
| opciones | lleva valores de atributos opcionales |
Devoluciones
- una nueva instancia de Skipgram
público estático Skipgram.Options minCount (Long minCount)
Parámetros
| minCount | El número mínimo de ocurrencias de palabras para que se incluyan en el vocabulario. |
|---|
submuestra pública estática Skipgram.Options (submuestra flotante)
Parámetros
| submuestra | Umbral de ocurrencia de palabras. Las palabras que aparecen con mayor frecuencia se muestrearán aleatoriamente. Establecer en 0 para deshabilitar. |
|---|
Salida pública <Long> totalWordsProcessed ()
El número total de palabras procesadas hasta el momento.
public static Skipgram.Options windowSize (Long windowSize)
Parámetros
| tamaño de ventana | El número de palabras para predecir a la izquierda y derecha del objetivo. |
|---|