StringNGrams
Koleksiyonlar ile düzeninizi koruyun
İçeriği tercihlerinize göre kaydedin ve kategorilere ayırın.
Düzensiz dize verilerinden ngramlar oluşturur.
Bu op, yalnızca dizeler içeren 1 düzensiz boyuta sahip düzensiz bir tensör kabul eder ve en içteki eksen boyunca birleştirilmiş, o dizenin ngramlarını içeren 1 düzensiz boyuta sahip düzensiz bir tensör çıktısı alır.
Genel Yöntemler
statik <T Sayıyı genişletir> StringNGrams <T> | create ( Kapsam kapsamı, Operand <String> verileri, Operand <T> dataSplits, String ayırıcı, List<Long> ngramWidths, String leftPad, String rightPad, Long padWidth, Boolean saveShortSequences) Yeni bir StringNGrams işlemini saran bir sınıf oluşturmak için fabrika yöntemi. |
Çıkış <Dize> | ngram () Çıkış ngramlarının tensör değerleri düzensiz tensördür. |
Çıkış <T> | |
Kalıtsal Yöntemler
Java.lang.Object sınıfından boolean | eşittir (Nesne arg0) |
son Sınıf<?> | getClass () |
int | hash kodu () |
son boşluk | bildir () |
son boşluk | tümünü bildir () |
Sicim | toString () |
son boşluk | bekle (uzun arg0, int arg1) |
son boşluk | bekle (uzun arg0) |
son boşluk | Beklemek () |
Genel Yöntemler
public static StringNGrams <T> create ( Kapsam kapsamı, Operand <String> verileri, Operand <T> dataSplits, String ayırıcı, List<Long> ngramWidths, String leftPad, String rightPad, Long padWidth, Boolean saveShortSequences)
Yeni bir StringNGrams işlemini saran bir sınıf oluşturmak için fabrika yöntemi.
Parametreler
kapsam | mevcut kapsam |
---|
veri | Ngramların oluşturulacağı düzensiz dize tensörünün değerleri tensörü. 1D dize tensörü olmalı. |
---|
veribölmeleri | Ngramları oluşturmak için düzensiz dizi tensörünün tensörünü böler. |
---|
ayırıcı | Belirtecin öğeleri arasına eklenecek dize. Ayırıcı olmaması için "" kullanın. |
---|
ngramGenişlikler | Oluşturulacak ngramların boyutları. |
---|
sol tuş takımı | Ngram dizisinin sol tarafını doldurmak için kullanılacak dize. Yalnızca pad_width != 0 ise kullanılır. |
---|
sağPad | Ngram dizisinin sağ tarafını doldurmak için kullanılacak dize. Yalnızca pad_width != 0 ise kullanılır. |
---|
ped Genişliği | Her dizinin her bir tarafına eklenecek dolgu öğelerinin sayısı. Bu değerden bağımsız olarak dolgunun hiçbir zaman 'ngram_widths'-1'den büyük olmayacağını unutmayın. "pad_width=-1" ise "max(ngram_widths)-1" öğelerini ekleyin. |
---|
İadeler
- StringNGrams'ın yeni bir örneği
genel Çıkış <String> ngram ()
Çıkış ngramlarının tensör değerleri düzensiz tensördür.
genel Çıkış <T> ngramsSplits ()
Çıkış ngramlarının tensörünü böler düzensiz tensör.
Aksi belirtilmediği sürece bu sayfanın içeriği Creative Commons Atıf 4.0 Lisansı altında ve kod örnekleri Apache 2.0 Lisansı altında lisanslanmıştır. Ayrıntılı bilgi için Google Developers Site Politikaları'na göz atın. Java, Oracle ve/veya satış ortaklarının tescilli ticari markasıdır. İçeriklerin bir bölümü NumPy lisansı kapsamındadır.
Son güncelleme tarihi: 2023-12-02 UTC.
[{
"type": "thumb-down",
"id": "missingTheInformationINeed",
"label":"İhtiyacım olan bilgiler yok"
},{
"type": "thumb-down",
"id": "tooComplicatedTooManySteps",
"label":"Çok karmaşık / çok fazla adım var"
},{
"type": "thumb-down",
"id": "outOfDate",
"label":"Güncel değil"
},{
"type": "thumb-down",
"id": "translationIssue",
"label":"Çeviri sorunu"
},{
"type": "thumb-down",
"id": "samplesCodeIssue",
"label":"Örnek veya kod sorunu"
},{
"type": "thumb-down",
"id": "otherDown",
"label":"Diğer"
}]
[{
"type": "thumb-up",
"id": "easyToUnderstand",
"label":"Anlaması kolay"
},{
"type": "thumb-up",
"id": "solvedMyProblem",
"label":"Sorunumu çözdü"
},{
"type": "thumb-up",
"id": "otherUp",
"label":"Diğer"
}]