کلاس نهایی عمومی Skipgram
یک فایل متنی را تجزیه می کند و مجموعه ای از نمونه ها را ایجاد می کند.
کلاس های تو در تو
| کلاس | Skipgram.Options | ویژگی های اختیاری برای Skipgram | |
روش های عمومی
| Skipgram استاتیک | ایجاد (حوزه دامنه ، نام فایل رشته، اندازه دسته طولانی، گزینهها... گزینهها) روش کارخانه برای ایجاد کلاسی که عملیات Skipgram جدید را بسته بندی می کند. |
| خروجی <عدد صحیح> | عصر کنونی () عدد دوره کنونی |
| خروجی <عدد صحیح> | مثال ها () وکتور شناسه کلمه. |
| خروجی <عدد صحیح> | برچسب ها () وکتور شناسه کلمه. |
| Static Skipgram.Options | minCount (Long minCount) |
| Static Skipgram.Options | نمونه فرعی (نمونه فرعی شناور) |
| خروجی <Long> | totalWordsProcessed () تعداد کل کلمات پردازش شده تا کنون. |
| خروجی <عدد صحیح> | vocabFreq () فرکانس کلمات |
| خروجی <String> | vocabWord () بردار کلمات در پیکره. |
| Static Skipgram.Options | اندازه پنجره (اندازه پنجره بلند) |
| خروجی <Long> | wordsPerEpoch () تعداد کلمات در هر دوره در فایل داده. |
روش های ارثی
روش های عمومی
ایجاد Skipgram ایستا عمومی (حوزه دامنه ، نام فایل رشته، اندازه دسته طولانی، گزینهها... گزینهها)
روش کارخانه برای ایجاد کلاسی که عملیات Skipgram جدید را بسته بندی می کند.
مولفه های
| محدوده | محدوده فعلی |
|---|---|
| نام فایل | نام فایل متنی مجموعه. |
| اندازه دسته ای | اندازه دسته تولید شده |
| گزینه ها | مقادیر ویژگی های اختیاری را حمل می کند |
برمی گرداند
- یک نمونه جدید از Skipgram
عمومی استاتیک Skipgram.Options minCount (Long minCount)
مولفه های
| minCount | حداقل تعداد تکرار کلمه برای گنجاندن آن در واژگان. |
|---|
عمومی استاتیک Skipgram.Options زیرنمونه (نمونه فرعی شناور)
مولفه های
| نمونه فرعی | آستانه برای وقوع کلمه. کلماتی که با فرکانس بالاتر ظاهر می شوند به طور تصادفی پایین نمونه می شوند. برای غیرفعال کردن، روی 0 تنظیم کنید. |
|---|
استاتیک عمومی Skipgram. Options windowSize (Long windowSize)
مولفه های
| اندازه پنجره | تعداد کلماتی که می توان در سمت چپ و راست هدف پیش بینی کرد. |
|---|