StringNGrams

StringNGrams من الفئة النهائية العامة

ينشئ ngrams من بيانات السلسلة الممزقة.

تقبل هذه العملية موترًا خشنًا يحتوي على بُعد واحد خشنًا يحتوي على سلاسل فقط ويخرج موترًا خشنًا به بُعدًا خشنًا واحدًا يحتوي على نجرامات من تلك السلسلة، متصلة على طول المحور الأعمق.

الأساليب العامة

ثابت <T يمتد الرقم> StringNGrams <T>
إنشاء (نطاق النطاق ، بيانات المعامل <String>، المعامل <T> dataSplits، فاصل السلسلة، List<Long> ngramWidths، String leftPad، String rightPad، LongpadWidth، BooleanserveShortSequences)
طريقة المصنع لإنشاء فئة تغلف عملية StringNGrams جديدة.
الإخراج <سلسلة>
نجرامز ()
موتر قيم الإخراج ngrams موتر خشنة.
الإخراج <T>
نجرامسبليتس ()
موتر الانقسامات من موتر الإخراج خشنة.

الطرق الموروثة

الأساليب العامة

إنشاء StringNGrams ثابت عام <T> ( نطاق النطاق، بيانات المعامل <String>، معامل <T> dataSplits، فاصل السلسلة، List<Long> ngramWidths، String leftPad، String rightPad، LongpadWidth، BooleanserveShortSequences)

طريقة المصنع لإنشاء فئة تغلف عملية StringNGrams جديدة.

حدود
نِطَاق النطاق الحالي
بيانات موتر القيم لموتر السلسلة المتعرجة لإخراج ngrams منه. يجب أن يكون موتر سلسلة 1D.
dataSplits موتر الانقسامات من موتر السلسلة الخشنة لإخراج ngrams منها.
فاصل السلسلة المطلوب إلحاقها بين عناصر الرمز المميز. استخدم "" لعدم وجود فاصل.
ngramWidths أحجام ngrams المراد إنشاؤها.
com.leftPad السلسلة المراد استخدامها لحشو الجانب الأيسر من تسلسل ngram. يُستخدم فقط إذا كانت قيمة Pad_width != 0.
com.rightPad السلسلة المراد استخدامها لحشو الجانب الأيمن من تسلسل ngram. يُستخدم فقط إذا كانت قيمة Pad_width != 0.
عرض الوسادة عدد عناصر الحشو المراد إضافتها إلى كل جانب من كل تسلسل. لاحظ أن المساحة المتروكة لن تكون أبدًا أكبر من 'ngram_widths'-1 بغض النظر عن هذه القيمة. إذا كان `pad_width=-1`، فأضف عناصر `max(ngram_widths)-1`.
عائدات
  • مثيل جديد من StringNGrams

الإخراج العام <String> ngrams ()

موتر قيم الإخراج ngrams موتر خشنة.

الإخراج العام <T> ngramsSplits ()

موتر الانقسامات من موتر الإخراج خشنة.