Skipgram

کلاس نهایی عمومی Skipgram

یک فایل متنی را تجزیه می کند و مجموعه ای از نمونه ها را ایجاد می کند.

کلاس های تو در تو

کلاس Skipgram.Options ویژگی های اختیاری برای Skipgram

ثابت ها

رشته OP_NAME نام این عملیات، همانطور که توسط موتور هسته TensorFlow شناخته می شود

روش های عمومی

Skipgram استاتیک
ایجاد (حوزه دامنه ، نام فایل رشته، اندازه دسته طولانی، گزینه‌ها... گزینه‌ها)
روش کارخانه برای ایجاد کلاسی که عملیات Skipgram جدید را بسته بندی می کند.
خروجی < TINT32 >
عصر کنونی ()
عدد دوره کنونی
خروجی < TINT32 >
مثال ها ()
وکتور شناسه کلمه.
خروجی < TINT32 >
برچسب ها ()
وکتور شناسه کلمه.
Static Skipgram.Options
minCount (Long minCount)
Static Skipgram.Options
نمونه فرعی (نمونه فرعی شناور)
خروجی < TINT64 >
totalWordsProcessed ()
تعداد کل کلمات پردازش شده تا کنون.
خروجی < TINT32 >
vocabFreq ()
فرکانس کلمات
خروجی < TRString >
vocabWord ()
بردار کلمات در پیکره.
Static Skipgram.Options
اندازه پنجره (اندازه پنجره بلند)
خروجی < TINT64 >
wordsPerEpoch ()
تعداد کلمات در هر دوره در فایل داده.

روش های ارثی

ثابت ها

رشته نهایی ثابت عمومی OP_NAME

نام این عملیات، همانطور که توسط موتور هسته TensorFlow شناخته می شود

مقدار ثابت: "Skipgram"

روش های عمومی

ایجاد Skipgram ایستا عمومی (حوزه دامنه ، نام فایل رشته، اندازه دسته طولانی، گزینه‌ها... گزینه‌ها)

روش کارخانه برای ایجاد کلاسی که عملیات Skipgram جدید را بسته بندی می کند.

مولفه های
محدوده محدوده فعلی
نام فایل نام فایل متنی مجموعه.
اندازه دسته ای اندازه دسته تولید شده
گزینه ها مقادیر ویژگی های اختیاری را حمل می کند
برمی گرداند
  • یک نمونه جدید از Skipgram

خروجی عمومی < TINT32 > currentEpoch ()

عدد دوره کنونی

خروجی عمومی < TINT32 > نمونه ها ()

وکتور شناسه کلمه.

خروجی عمومی < TINT32 > برچسب ها ()

وکتور شناسه کلمه.

عمومی استاتیک Skipgram.Options minCount (Long minCount)

مولفه های
minCount حداقل تعداد تکرار کلمه برای گنجاندن آن در واژگان.

عمومی استاتیک Skipgram.Options زیرنمونه (نمونه فرعی شناور)

مولفه های
نمونه فرعی آستانه برای وقوع کلمه. کلماتی که با فرکانس بالاتر ظاهر می شوند به طور تصادفی پایین نمونه می شوند. برای غیرفعال کردن، روی 0 تنظیم کنید.

خروجی عمومی < TINT64 > totalWordsProcessed ()

تعداد کل کلمات پردازش شده تا کنون.

خروجی عمومی < TINT32 > vocabFreq ()

فرکانس کلمات به ترتیب غیر صعودی مرتب شده است.

خروجی عمومی < TString > vocabWord ()

بردار کلمات در پیکره.

استاتیک عمومی Skipgram. Options windowSize (Long windowSize)

مولفه های
اندازه پنجره تعداد کلماتی که می توان در سمت چپ و راست هدف پیش بینی کرد.

خروجی عمومی < TINT64 > wordsPerEpoch ()

تعداد کلمات در هر دوره در فایل داده.