Skipgram

کلاس نهایی عمومی Skipgram

یک فایل متنی را تجزیه می کند و مجموعه ای از نمونه ها را ایجاد می کند.

کلاس های تو در تو

کلاس Skipgram.Options ویژگی های اختیاری برای Skipgram

روش های عمومی

Skipgram استاتیک
ایجاد (حوزه دامنه ، نام فایل رشته، اندازه دسته طولانی، گزینه‌ها... گزینه‌ها)
روش کارخانه برای ایجاد کلاسی که عملیات Skipgram جدید را بسته بندی می کند.
خروجی <عدد صحیح>
عصر کنونی ()
عدد دوره کنونی
خروجی <عدد صحیح>
مثال ها ()
وکتور شناسه کلمه.
خروجی <عدد صحیح>
برچسب ها ()
وکتور شناسه کلمه.
Static Skipgram.Options
minCount (Long minCount)
Static Skipgram.Options
نمونه فرعی (نمونه فرعی شناور)
خروجی <Long>
totalWordsProcessed ()
تعداد کل کلمات پردازش شده تا کنون.
خروجی <عدد صحیح>
vocabFreq ()
فرکانس کلمات
خروجی <String>
vocabWord ()
بردار کلمات در پیکره.
Static Skipgram.Options
اندازه پنجره (اندازه پنجره بلند)
خروجی <Long>
wordsPerEpoch ()
تعداد کلمات در هر دوره در فایل داده.

روش های ارثی

روش های عمومی

ایجاد Skipgram ایستا عمومی (حوزه دامنه ، نام فایل رشته، اندازه دسته طولانی، گزینه‌ها... گزینه‌ها)

روش کارخانه برای ایجاد کلاسی که عملیات Skipgram جدید را بسته بندی می کند.

مولفه های
محدوده محدوده فعلی
نام فایل نام فایل متنی مجموعه.
اندازه دسته ای اندازه دسته تولید شده
گزینه ها مقادیر ویژگی های اختیاری را حمل می کند
برمی گرداند
  • یک نمونه جدید از Skipgram

خروجی عمومی <Integer> currentEpoch ()

عدد دوره کنونی

نمونه های خروجی عمومی <Integer> ()

وکتور شناسه کلمه.

برچسب های <صحیح> خروجی عمومی ()

وکتور شناسه کلمه.

عمومی استاتیک Skipgram.Options minCount (Long minCount)

مولفه های
minCount حداقل تعداد تکرار کلمه برای گنجاندن آن در واژگان.

عمومی استاتیک Skipgram.Options زیرنمونه (نمونه فرعی شناور)

مولفه های
نمونه فرعی آستانه برای وقوع کلمه. کلماتی که با فرکانس بالاتر ظاهر می شوند به طور تصادفی پایین نمونه می شوند. برای غیرفعال کردن، روی 0 تنظیم کنید.

خروجی عمومی <Long> totalWordsProcessed ()

تعداد کل کلمات پردازش شده تا کنون.

خروجی عمومی <Integer> vocabFreq ()

فرکانس کلمات به ترتیب غیر صعودی مرتب شده است.

خروجی عمومی <String> vocabWord ()

بردار کلمات در پیکره.

استاتیک عمومی Skipgram. Options windowSize (Long windowSize)

مولفه های
اندازه پنجره تعداد کلماتی که می توان در سمت چپ و راست هدف پیش بینی کرد.

خروجی عمومی <Long> wordsPerEpoch ()

تعداد کلمات در هر دوره در فایل داده.