StringNGrams

genel final sınıfı StringNGrams

Düzensiz dize verilerinden ngramlar oluşturur.

Bu op, yalnızca dizeler içeren 1 düzensiz boyuta sahip düzensiz bir tensör kabul eder ve en içteki eksen boyunca birleştirilmiş, o dizenin ngramlarını içeren 1 düzensiz boyuta sahip düzensiz bir tensör çıktısı alır.

Genel Yöntemler

statik <T Sayıyı genişletir> StringNGrams <T>
create ( Kapsam kapsamı, Operand <String> verileri, Operand <T> dataSplits, String ayırıcı, List<Long> ngramWidths, String leftPad, String rightPad, Long padWidth, Boolean saveShortSequences)
Yeni bir StringNGrams işlemini saran bir sınıf oluşturmak için fabrika yöntemi.
Çıkış <Dize>
ngram ()
Çıkış ngramlarının tensör değerleri düzensiz tensördür.
Çıkış <T>
ngramlarBölmeler ()
Çıkış ngramlarının tensörünü böler düzensiz tensör.

Kalıtsal Yöntemler

Genel Yöntemler

public static StringNGrams <T> create ( Kapsam kapsamı, Operand <String> verileri, Operand <T> dataSplits, String ayırıcı, List<Long> ngramWidths, String leftPad, String rightPad, Long padWidth, Boolean saveShortSequences)

Yeni bir StringNGrams işlemini saran bir sınıf oluşturmak için fabrika yöntemi.

Parametreler
kapsam mevcut kapsam
veri Ngramların oluşturulacağı düzensiz dize tensörünün değerleri tensörü. 1D dize tensörü olmalı.
veribölmeleri Ngramları oluşturmak için düzensiz dizi tensörünün tensörünü böler.
ayırıcı Belirtecin öğeleri arasına eklenecek dize. Ayırıcı olmaması için "" kullanın.
ngramGenişlikler Oluşturulacak ngramların boyutları.
sol tuş takımı Ngram dizisinin sol tarafını doldurmak için kullanılacak dize. Yalnızca pad_width != 0 ise kullanılır.
sağPad Ngram dizisinin sağ tarafını doldurmak için kullanılacak dize. Yalnızca pad_width != 0 ise kullanılır.
ped Genişliği Her dizinin her bir tarafına eklenecek dolgu öğelerinin sayısı. Bu değerden bağımsız olarak dolgunun hiçbir zaman 'ngram_widths'-1'den büyük olmayacağını unutmayın. "pad_width=-1" ise "max(ngram_widths)-1" öğelerini ekleyin.
İadeler
  • StringNGrams'ın yeni bir örneği

genel Çıkış <String> ngram ()

Çıkış ngramlarının tensör değerleri düzensiz tensördür.

genel Çıkış <T> ngramsSplits ()

Çıkış ngramlarının tensörünü böler düzensiz tensör.