UnicodeEncode

genel son sınıf UnicodeEncode

Bir ints tensörünü unicode dizelere kodlayın.

"output[i]" ifadesinin, "input_values[input_splits[i]:input_splits[i+1]]" içindeki Unicode kod noktalarının "output_encoding" kullanılarak kodlanmasıyla oluşturulduğu bir dize vektörü döndürür.

---

Örnek:

input_values = [72, 101, 108, 108, 111, 87, 111, 114, 108, 100]
 input_splits = [0, 5, 10]
 output_encoding = 'UTF-8'
 
 output = ['Hello', 'World']
 

İç İçe Sınıflar

sınıf UnicodeEncode.Options UnicodeEncode için isteğe bağlı özellikler

Sabitler

Sicim OP_NAME Bu operasyonun TensorFlow çekirdek motoru tarafından bilinen adı

Genel Yöntemler

Çıkış < TString >
Çıkış olarak ()
Tensörün sembolik tutamacını döndürür.
statik UnicodeEncode
create ( Kapsam kapsamı, İşlenen < TInt32 > inputValues, İşlenen <? extends TNumber > inputSplits, String çıktıEncoding, Seçenekler... seçenekler)
Yeni bir UnicodeEncode işlemini saran bir sınıf oluşturmaya yönelik fabrika yöntemi.
statik UnicodeEncode.Options
hatalar (Dize hataları)
Çıkış < TString >
çıktı ()
Sağlanan unicode kod noktalarından kodlanan dizelerin 1-B Tensörü.
statik UnicodeEncode.Options
replacementChar (Uzun değiştirmeChar)

Kalıtsal Yöntemler

Sabitler

genel statik son Dize OP_NAME

Bu operasyonun TensorFlow çekirdek motoru tarafından bilinen adı

Sabit Değer: "UnicodeEncode"

Genel Yöntemler

genel Çıkış < TString > asOutput ()

Tensörün sembolik tutamacını döndürür.

TensorFlow işlemlerinin girdileri, başka bir TensorFlow işleminin çıktılarıdır. Bu yöntem, girişin hesaplanmasını temsil eden sembolik bir tanıtıcı elde etmek için kullanılır.

public static UnicodeEncode create ( Kapsam kapsamı, İşlenen < TInt32 > inputValues, İşlenen <? extends TNumber > inputSplits, String çıktıEncoding, Seçenekler... seçenekler)

Yeni bir UnicodeEncode işlemini saran bir sınıf oluşturmaya yönelik fabrika yöntemi.

Parametreler
kapsam mevcut kapsam
giriş Değerleri Kodlanması gereken unicode kod noktalarını içeren 1 boyutlu tensör.
girişbölünmeleri Unicode kod noktalarının dizelere nasıl bölünmesi gerektiğini belirten 1 boyutlu tensör. Özellikle, "output[i]", "input_values[input_splits[i]:input_splits[i+1]]" dilimindeki kod noktalarının kodlanmasıyla oluşturulur.
çıktıKodlama Çıkış dizelerinin Unicode kodlaması. Geçerli kodlamalar şunlardır: "UTF-8", "UTF-16-BE" ve "UTF-32-BE".
seçenekler isteğe bağlı nitelik değerlerini taşır
İadeler
  • UnicodeEncode'un yeni bir örneği

genel statik UnicodeEncode.Options hataları (Dize hataları)

Parametreler
hatalar Girişte geçersiz biçimlendirme bulunduğunda hata işleme politikası. 'Strict' değeri, işlemin herhangi bir geçersiz giriş biçimlendirmesinde InvalidArgument hatası üretmesine neden olur. 'Değiştir' değeri (varsayılan), işlemin girişteki geçersiz biçimlendirmeyi 'replacement_char' kod noktasıyla değiştirmesine neden olur. 'Yoksay' değeri, işlemin girişteki herhangi bir geçersiz biçimlendirmeyi atlamasına ve buna karşılık gelen bir çıkış karakteri üretmemesine neden olur.

genel Çıkış < TString > çıkış ()

Sağlanan unicode kod noktalarından kodlanan dizelerin 1-B Tensörü.

public static UnicodeEncode.Options replacementChar (Uzun replacementChar)

Parametreler
yedek karakter `errors='replace'` durumunda girişteki geçersiz biçimlendirmenin yerine kullanılacak yedek karakter kod noktası. Geçerli herhangi bir unicode kod noktası kullanılabilir. Varsayılan değer, varsayılan unicode değiştirme karakterinin 0xFFFD (U+65533) olmasıdır.