StringNGrams

کلاس نهایی عمومی StringNGrams

ngram ها را از داده های رشته ای ایجاد می کند.

این عملیات یک تانسور ژنده‌دار با 1 بعد ژنده‌دار که فقط شامل رشته‌ها است را می‌پذیرد و یک تانسور ژنده‌دار با 1 بعد ژنده‌دار حاوی نانوگرم‌های آن رشته را که در امتداد داخلی‌ترین محور به هم وصل شده‌اند، خروجی می‌دهد.

روش های عمومی

استاتیک <T تعداد را گسترش می دهد> StringNGrams <T>
ایجاد ( scope scope، Operand <String> data، Operand <T> dataSplits، String separator، List<Long> ngramWidths، String leftPad، String rightPad، Long padWidth، Boolean maintenanceShortSequences)
روش کارخانه برای ایجاد کلاسی که عملیات StringNGrams جدید را بسته بندی می کند.
خروجی <String>
ngrams ()
تانسور مقادیر تانسور ngrams خروجی.
خروجی <T>
ngramsSplits ()
تانسور تقسیم تانسور ngrams خروجی راگ شده.

روش های ارثی

روش های عمومی

StringNGrams استاتیک عمومی <T> ایجاد می کند ( دامنه دامنه ، داده عملوند <String>، عملوند <T> dataSplits، جداکننده رشته، List<Long> ngramWidths، String leftPad، String rightPad، Long padWidth، Boolean maintenanceShortSequences)

روش کارخانه برای ایجاد کلاسی که عملیات StringNGrams جدید را بسته بندی می کند.

مولفه های
محدوده محدوده فعلی
داده ها تانسور مقادیر تانسور رشته‌ای ناهموار برای ایجاد ngram از آن. باید یک تانسور رشته 1 بعدی باشد.
داده تقسیم تانسور تانسور رشته‌ای کهنه را تقسیم می‌کند تا از آن ngram بسازد.
جداکننده رشته ای که بین عناصر توکن الحاق می شود. بدون جداکننده از "" استفاده کنید.
ngramWidths اندازه های ngram برای ایجاد.
چپ پد رشته ای که برای قرار دادن صفحه سمت چپ دنباله ngram استفاده می شود. فقط در صورتی استفاده می شود که pad_width != 0 باشد.
پد راست رشته ای که برای قرار دادن صفحه سمت راست دنباله ngram استفاده می شود. فقط در صورتی استفاده می شود که pad_width != 0 باشد.
پهنای پد تعداد عناصر بالشتکی برای افزودن به هر طرف هر دنباله. توجه داشته باشید که بدون در نظر گرفتن این مقدار، padding هرگز بزرگتر از 'ngram_widths'-1 نخواهد بود. اگر «pad_width=-1»، سپس عناصر «max(ngram_widths)-1» را اضافه کنید.
برمی گرداند
  • یک نمونه جدید از StringNGrams

خروجی عمومی <رشته> ngrams ()

تانسور مقادیر تانسور ngrams خروجی.

خروجی عمومی <T> ngramsSplits ()

تانسور تقسیم تانسور ngrams خروجی راگ شده.