警告:このAPIは非推奨であり、置き換えが安定した後 TensorFlowの将来のバージョンで削除される予定です。

このページは Cloud Translation API によって翻訳されました。
Switch to English

UnicodeDecode

パブリックファイナルクラスUnicodeDecode

`input`の各文字列をUnicodeコードポイントのシーケンスにデコードします。

すべての文字列の文字コードポイントは、単一のベクトル `char_values`を使用して返され、文字列は行優先の順序で文字に展開されます。

`row_splits`テンソルは、各入力文字列のコードポイントが` char_values`テンソル内で開始および終了する場所を示します。特に、 `i`番目の文字列の値(行優先順)はスライス` [row_splits [i]:row_splits [i +1]] `に格納されます。したがって:

  • `char_values [row_splits [i] + j]`は、 `i`番目の文字列の` j`番目の文字のUnicodeコードポイントです(行優先順)。
  • `row_splits [i + 1] --row_splits [i]`は、 `i`番目の文字列の文字数です(行優先順)。

ネストされたクラス

クラスUnicodeDecode.Options UnicodeDecodeオプションの属性

パブリックメソッド

出力<整数>
charValues ()
デコードされたコードポイントを含む1Dint32テンソル。
static <T extends Number> UnicodeDecode <T>
createスコープスコープ、オペランド<文字列>入力、文字列inputEncoding、クラス<T> Tsplits、オプション...オプション)
新しいUnicodeDecode操作をラップするクラスを作成するファクトリメソッド。
静的UnicodeDecode <Long>
createスコープスコープ、オペランド<文字列>入力、文字列inputEncoding、オプション...オプション)
デフォルトの出力タイプを使用して、新しいUnicodeDecode操作をラップするクラスを作成するファクトリメソッド。
静的UnicodeDecode.Options
エラー(文字列エラー)
静的UnicodeDecode.Options
replaceControlCharacters (ブール値replaceControlCharacters)
静的UnicodeDecode.Options
replaceChar (長いreplacementChar)
出力<T>
rowSplits ()
行分割を含む1Dint32テンソル。

継承されたメソッド

パブリックメソッド

public Output <Integer> charValues ()

デコードされたコードポイントを含む1Dint32テンソル。

public static UnicodeDecode <T> create スコープスコープ、オペランド<文字列>入力、文字列inputEncoding、クラス<T> Tsplits、オプション...オプション)

新しいUnicodeDecode操作をラップするクラスを作成するファクトリメソッド。

パラメーター
範囲現在のスコープ
入力デコードするテキスト。どんな形でもかまいません。出力はchar値のベクトルにフラット化されることに注意してください。
inputEncoding入力文字列のテキストエンコーディング。これは、ICUucnvアルゴリズムコンバーターでサポートされているエンコーディングのいずれかです。例: `" UTF-16 "、" US ASCII "、" UTF-8 "`。
オプションオプションの属性値を運ぶ
戻り値
  • UnicodeDecodeの新しいインスタンス

public static UnicodeDecode <Long> create スコープスコープ、オペランド<文字列>入力、文字列inputEncoding、オプション...オプション)

デフォルトの出力タイプを使用して、新しいUnicodeDecode操作をラップするクラスを作成するファクトリメソッド。

パラメーター
範囲現在のスコープ
入力デコードするテキスト。どんな形でもかまいません。出力はchar値のベクトルにフラット化されることに注意してください。
inputEncoding入力文字列のテキストエンコーディング。これは、ICUucnvアルゴリズムコンバーターでサポートされているエンコーディングのいずれかです。例: `" UTF-16 "、" US ASCII "、" UTF-8 "`。
オプションオプションの属性値を運ぶ
戻り値
  • UnicodeDecodeの新しいインスタンス

public static UnicodeDecode.Optionsエラー(文字列エラー)

パラメーター
エラー入力に無効なフォーマットが見つかった場合のエラー処理ポリシー。 'strict'の値により、操作は無効な入力フォーマットに対してInvalidArgumentエラーを生成します。 'replace'(デフォルト)の値により、操作は入力の無効なフォーマットを `replacement_char`コードポイントに置き換えます。 'ignore'の値を指定すると、操作は入力の無効なフォーマットをスキップし、対応する出力文字を生成しません。

public static UnicodeDecode.Options replaceControlCharacters (ブール値replaceControlCharacters)

パラメーター
replaceControlCharacters C0制御文字(00-1F)を `replacement_char`に置き換えるかどうか。デフォルトはfalseです。

パブリック静的UnicodeDecode.Options replacementChar(ロングreplacementChar)

パラメーター
replaceChar `errors = 'replace'`の場合、入力の無効なフォーマットの代わりに使用される置換文字コードポイント。任意の有効なUnicodeコードポイントを使用できます。デフォルト値は、デフォルトのUnicode置換文字が0xFFFDまたはU + 65533です。)

public Output <T> rowSplits ()

行分割を含む1Dint32テンソル。