Classe finale publique Skipgram
Analyse un fichier texte et crée un lot d'exemples.
Classes imbriquées
classe | Skipgram.Options | Attributs facultatifs pour Skipgram |
Méthodes publiques
Skipgramme statique | créer (portée de portée , nom de fichier de chaîne, taille de lot long, options... options) Méthode d'usine pour créer une classe encapsulant une nouvelle opération Skipgram. |
Sortie <Entier> | époque actuelle () Le numéro de l’époque actuelle. |
Sortie <Entier> | exemples () Un vecteur d'identifiants de mots. |
Sortie <Entier> | Étiquettes () Un vecteur d'identifiants de mots. |
Skipgram.Options statique | minCount (Long minCount) |
Skipgram.Options statique | sous-échantillon (sous-échantillon flottant) |
Sortie <Long> | totalMotsProcessus () Le nombre total de mots traités jusqu'à présent. |
Sortie <Entier> | vocabulaireFreq () Fréquences des mots. |
Sortie <Chaîne> | vocabulaireMot () Un vecteur de mots dans le corpus. |
Skipgram.Options statique | Taille de la fenêtre (Taille de la fenêtre longue) |
Sortie <Long> | motsParEpoch () Nombre de mots par époque dans le fichier de données. |
Méthodes héritées
Méthodes publiques
création de Skipgram statique public (portée de la portée , nom de fichier de chaîne, taille de lot long, options... options)
Méthode d'usine pour créer une classe encapsulant une nouvelle opération Skipgram.
Paramètres
portée | portée actuelle |
---|---|
nom de fichier | Le nom du fichier texte du corpus. |
taille du lot | La taille du lot produit. |
choix | porte des valeurs d'attributs facultatifs |
Retour
- une nouvelle instance de Skipgram
public statique Skipgram.Options minCount (Long minCount)
Paramètres
nombremin | Le nombre minimum d'occurrences de mots pour qu'il soit inclus dans le vocabulaire. |
---|
Sous-échantillon Skipgram.Options statique public (sous-échantillon Float)
Paramètres
sous-échantillon | Seuil d’occurrence des mots. Les mots qui apparaissent avec une fréquence plus élevée seront sous-échantillonnés de manière aléatoire. Réglez sur 0 pour désactiver. |
---|
public statique Skipgram.Options windowSize (Long windowSize)
Paramètres
la taille de la fenêtre | Le nombre de mots à prédire à gauche et à droite de la cible. |
---|