StringNGrams

публичный финальный класс StringNGrams

Создает ngrams из неровных строковых данных.

Эта операция принимает неровный тензор с 1 неровным измерением, содержащим только строки, и выводит неровный тензор с 1 неровным измерением, содержащим nграммы этой строки, соединенные по самой внутренней оси.

Публичные методы

static <T расширяет число> StringNGrams <T>
create ( Область области, данные операнда <String>, операнд <T> dataSplits, разделитель строк, List<Long> ngramWidths, строка leftPad, строка rightPad, LongpadWidth, логическое значение saveShortSequences)
Фабричный метод для создания класса, обертывающего новую операцию StringNGrams.
Вывод <Строка>
нграмм ()
Тензор значений выходного рваного тензора ngrams.
Выход <Т>
нграммСплитс ()
Тензор разделения выходного рваного тензора ngrams.

Унаследованные методы

Публичные методы

public static StringNGrams <T> create (область области действия , данные операнда <String>, операнд <T> dataSplits, разделитель строк, List<Long> ngramWidths, String leftPad, String rightPad, LongpadWidth, логическое значение saveShortSequences)

Фабричный метод для создания класса, обертывающего новую операцию StringNGrams.

Параметры
объем текущий объем
данные Тензор значений тензора неровных строк, из которого нужно составить ngrams. Должен быть одномерным струнным тензором.
разделение данных Тензор разделения тензора рваной строки, из которого создаются ngrams.
разделитель Строка, добавляемая между элементами токена. Используйте "" без разделителя.
ngramWidths Размеры создаваемых ngrams.
левыйPad Строка, используемая для заполнения левой части последовательности ngram. Используется только в том случае, если Pad_width != 0.
правыйPad Строка, используемая для заполнения правой части последовательности ngram. Используется только в том случае, если Pad_width != 0.
ширина площадки Количество элементов заполнения, добавляемых к каждой стороне каждой последовательности. Обратите внимание, что заполнение никогда не будет больше, чем «ngram_widths»-1, независимо от этого значения. Если `pad_width=-1`, добавьте элементы `max(ngram_widths)-1`.
Возврат
  • новый экземпляр StringNGrams

публичный вывод <String> ngrams ()

Тензор значений выходного рваного тензора ngrams.

публичный вывод <T> ngramsSplits ()

Тензор разделения выходного рваного тензора ngrams.