Skipgram

Classe finale publique Skipgram

Analyse un fichier texte et crée un lot d'exemples.

Classes imbriquées

classe Skipgram.Options Attributs facultatifs pour Skipgram

Méthodes publiques

Skipgramme statique
créer (portée de portée , nom de fichier de chaîne, taille de lot long, options... options)
Méthode d'usine pour créer une classe encapsulant une nouvelle opération Skipgram.
Sortie <Entier>
époque actuelle ()
Le numéro de l’époque actuelle.
Sortie <Entier>
exemples ()
Un vecteur d'identifiants de mots.
Sortie <Entier>
Étiquettes ()
Un vecteur d'identifiants de mots.
Skipgram.Options statique
minCount (Long minCount)
Skipgram.Options statique
sous-échantillon (sous-échantillon flottant)
Sortie <Long>
totalMotsProcessus ()
Le nombre total de mots traités jusqu'à présent.
Sortie <Entier>
vocabulaireFreq ()
Fréquences des mots.
Sortie <Chaîne>
vocabulaireMot ()
Un vecteur de mots dans le corpus.
Skipgram.Options statique
Taille de la fenêtre (Taille de la fenêtre longue)
Sortie <Long>
motsParEpoch ()
Nombre de mots par époque dans le fichier de données.

Méthodes héritées

Méthodes publiques

création de Skipgram statique public (portée de la portée , nom de fichier de chaîne, taille de lot long, options... options)

Méthode d'usine pour créer une classe encapsulant une nouvelle opération Skipgram.

Paramètres
portée portée actuelle
nom de fichier Le nom du fichier texte du corpus.
taille du lot La taille du lot produit.
choix porte des valeurs d'attributs facultatifs
Retour
  • une nouvelle instance de Skipgram

sortie publique <Integer> currentEpoch ()

Le numéro de l’époque actuelle.

exemples de sortie publique <Integer> ()

Un vecteur d'identifiants de mots.

étiquettes de sortie publique <Integer> ()

Un vecteur d'identifiants de mots.

public statique Skipgram.Options minCount (Long minCount)

Paramètres
nombremin Le nombre minimum d'occurrences de mots pour qu'il soit inclus dans le vocabulaire.

Sous-échantillon Skipgram.Options statique public (sous-échantillon Float)

Paramètres
sous-échantillon Seuil d’occurrence des mots. Les mots qui apparaissent avec une fréquence plus élevée seront sous-échantillonnés de manière aléatoire. Réglez sur 0 pour désactiver.

sortie publique <Long> totalWordsProcessed ()

Le nombre total de mots traités jusqu'à présent.

sortie publique <Integer> vocabFreq ()

Fréquences des mots. Trié dans l'ordre non croissant.

sortie publique <String> vocabWord ()

Un vecteur de mots dans le corpus.

public statique Skipgram.Options windowSize (Long windowSize)

Paramètres
la taille de la fenêtre Le nombre de mots à prédire à gauche et à droite de la cible.

sortie publique <Long> motsPerEpoch ()

Nombre de mots par époque dans le fichier de données.