کلاس نهایی عمومی Skipgram
یک فایل متنی را تجزیه می کند و مجموعه ای از نمونه ها را ایجاد می کند.
کلاس های تو در تو
کلاس | Skipgram.Options | ویژگی های اختیاری برای Skipgram |
روش های عمومی
Skipgram استاتیک | ایجاد (حوزه دامنه ، نام فایل رشته، اندازه دسته طولانی، گزینهها... گزینهها) روش کارخانه برای ایجاد کلاسی که عملیات Skipgram جدید را بسته بندی می کند. |
خروجی <عدد صحیح> | عصر کنونی () عدد دوره کنونی |
خروجی <عدد صحیح> | مثال ها () وکتور شناسه کلمه. |
خروجی <عدد صحیح> | برچسب ها () وکتور شناسه کلمه. |
Static Skipgram.Options | minCount (Long minCount) |
Static Skipgram.Options | نمونه فرعی (نمونه فرعی شناور) |
خروجی <Long> | totalWordsProcessed () تعداد کل کلمات پردازش شده تا کنون. |
خروجی <عدد صحیح> | vocabFreq () فرکانس کلمات |
خروجی <String> | vocabWord () بردار کلمات در پیکره. |
Static Skipgram.Options | اندازه پنجره (اندازه پنجره بلند) |
خروجی <Long> | wordsPerEpoch () تعداد کلمات در هر دوره در فایل داده. |
روش های ارثی
روش های عمومی
ایجاد Skipgram ایستا عمومی (حوزه دامنه ، نام فایل رشته، اندازه دسته طولانی، گزینهها... گزینهها)
روش کارخانه برای ایجاد کلاسی که عملیات Skipgram جدید را بسته بندی می کند.
مولفه های
محدوده | محدوده فعلی |
---|---|
نام فایل | نام فایل متنی مجموعه. |
اندازه دسته ای | اندازه دسته تولید شده |
گزینه ها | مقادیر ویژگی های اختیاری را حمل می کند |
برمی گرداند
- یک نمونه جدید از Skipgram
عمومی استاتیک Skipgram.Options minCount (Long minCount)
مولفه های
minCount | حداقل تعداد تکرار کلمه برای گنجاندن آن در واژگان. |
---|
عمومی استاتیک Skipgram.Options زیرنمونه (نمونه فرعی شناور)
مولفه های
نمونه فرعی | آستانه برای وقوع کلمه. کلماتی که با فرکانس بالاتر ظاهر می شوند به طور تصادفی پایین نمونه می شوند. برای غیرفعال کردن، روی 0 تنظیم کنید. |
---|
استاتیک عمومی Skipgram. Options windowSize (Long windowSize)
مولفه های
اندازه پنجره | تعداد کلماتی که می توان در سمت چپ و راست هدف پیش بینی کرد. |
---|