جریان تنسور:: عملیات:: StringNGrams

#include <string_ops.h>

ngram ها را از داده های رشته ای ایجاد می کند.

خلاصه

این عملیات یک تانسور ژنده‌دار با 1 بعد ژنده‌دار که فقط شامل رشته‌ها است را می‌پذیرد و یک تانسور ژنده‌دار با 1 بعد ژنده‌دار حاوی نانوگرم‌های آن رشته را که در امتداد داخلی‌ترین محور به هم وصل شده‌اند، خروجی می‌دهد.

استدلال ها:

  • scope: یک شی Scope
  • داده: تانسور مقادیر تانسور رشته‌ای که از آن ngram ساخته می‌شود. باید یک تانسور رشته 1 بعدی باشد.
  • data_splits: تانسور تانسور رشته‌ای راگ شده را تقسیم می‌کند تا ngram‌ها را از آن بسازد.
  • جداکننده: رشته ای که بین عناصر توکن الحاق می شود. بدون جداکننده از "" استفاده کنید.
  • ngram_widths: اندازه های ngram برای ایجاد.
  • left_pad: رشته ای که برای پد کردن سمت چپ دنباله ngram استفاده می شود. فقط در صورتی استفاده می شود که pad_width != 0 باشد.
  • right_pad: رشته ای که برای پد کردن سمت راست دنباله ngram استفاده می شود. فقط در صورتی استفاده می شود که pad_width != 0 باشد.
  • pad_width: تعداد عناصر padding برای اضافه کردن به هر طرف هر دنباله. توجه داشته باشید که بدون در نظر گرفتن این مقدار، padding هرگز بزرگتر از 'ngram_widths'-1 نخواهد بود. اگر pad_width=-1 باشد، آنگاه عناصر max(ngram_widths)-1 را اضافه کنید.

برمی گرداند:

  • Output ngrams: تانسور مقادیر تانسور ngrams خروجی ragged.
  • Output ngrams_splits: تانسور تقسیم تانسور خروجی ngrams ragged.

سازندگان و ویرانگرها

StringNGrams (const :: tensorflow::Scope & scope, :: tensorflow::Input data, :: tensorflow::Input data_splits, StringPiece separator, const gtl::ArraySlice< int > & ngram_widths, StringPiece left_pad, StringPiece right_pad, int64 pad_width, bool preserve_short_sequences)

صفات عمومی

ngrams
ngrams_splits
operation

صفات عمومی

ngrams

::tensorflow::Output ngrams

ngrams_splits

::tensorflow::Output ngrams_splits

عمل

Operation operation

توابع عمومی

StringNGrams

 StringNGrams(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input data,
  ::tensorflow::Input data_splits,
  StringPiece separator,
  const gtl::ArraySlice< int > & ngram_widths,
  StringPiece left_pad,
  StringPiece right_pad,
  int64 pad_width,
  bool preserve_short_sequences
)