テンソルフロー::作戦::固定UnigramCandidateSampler::属性

#include <candidate_sampling_ops.h>

FixedUnigramCandidateSamplerのオプションの属性セッター。

まとめ

パブリック属性

distortion_ = 1.0f
float
num_reserved_ids_ = 0
int64
num_shards_ = 1
int64
seed2_ = 0
int64
seed_ = 0
int64
shard_ = 0
int64
unigrams_ = {}
gtl::ArraySlice< float >
vocab_file_ = ""
StringPiece

公共機能

Distortion (float x)
TF_MUST_USE_RESULT Attrs
歪みはユニグラム確率分布を歪めるために使用されます。
NumReservedIds (int64 x)
TF_MUST_USE_RESULT Attrs
オプションで、ユーザーはいくつかの予約済み ID を [0, ..., num_reserved_ids) の範囲で追加できます。
NumShards (int64 x)
TF_MUST_USE_RESULT Attrs
サンプラーを使用して、元の範囲のサブセットからサンプリングすることで、並列処理を通じて計算全体を高速化できます。
Seed (int64 x)
TF_MUST_USE_RESULT Attrs
シードまたはシード 2 のいずれかが 0 以外に設定されている場合、乱数ジェネレータには指定されたシードがシードされます。
Seed2 (int64 x)
TF_MUST_USE_RESULT Attrs
シードの衝突を避けるための 2 番目のシード。
Shard (int64 x)
TF_MUST_USE_RESULT Attrs
サンプラーを使用して、元の範囲のサブセットからサンプリングすることで、並列処理を通じて計算全体を高速化できます。
Unigrams (const gtl::ArraySlice< float > & x)
TF_MUST_USE_RESULT Attrs
ユニグラム数または確率のリスト。ID ごとに 1 つずつ、順番に並べられます。
VocabFile (StringPiece x)
TF_MUST_USE_RESULT Attrs
このファイル (CSV のような形式である必要があります) 内の各有効な行は、有効な単語 ID に対応します。

パブリック属性

ねじれ_

float tensorflow::ops::FixedUnigramCandidateSampler::Attrs::distortion_ = 1.0f

num_reserved_ids_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_reserved_ids_ = 0

num_shards_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_shards_ = 1

シード2_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed2_ = 0

シード_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed_ = 0

シャード_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::shard_ = 0

ユニグラム_

gtl::ArraySlice< float > tensorflow::ops::FixedUnigramCandidateSampler::Attrs::unigrams_ = {}

語彙ファイル_

StringPiece tensorflow::ops::FixedUnigramCandidateSampler::Attrs::vocab_file_ = ""

公共機能

ねじれ

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Distortion(
  float x
)

歪みはユニグラム確率分布を歪めるために使用されます。

各重みは、内部ユニグラム分布に追加される前に、まず歪みの乗に引き上げられます。結果として、distortion = 1.0 は通常のユニグラム サンプリング (語彙ファイルで定義されたとおり) を提供し、distortion = 0.0 は均一な分布を提供します。

デフォルトは 1

NumReservedIds

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumReservedIds(
  int64 x
)

オプションで、ユーザーはいくつかの予約済み ID を [0, ..., num_reserved_ids) の範囲で追加できます。

1 つの使用例は、特別な未知の単語トークンが ID 0 として使用されることです。これらの ID のサンプリング確率は 0 になります。

デフォルトは 0

シャード数

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumShards(
  int64 x
)

サンプラーを使用して、元の範囲のサブセットからサンプリングすることで、並列処理を通じて計算全体を高速化できます。

このパラメーター (「shard」と合わせて) は、計算全体で使用されているパーティションの数を示します。

デフォルトは 1

シード

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed(
  int64 x
)

シードまたはシード 2 のいずれかが 0 以外に設定されている場合、乱数ジェネレータには指定されたシードがシードされます。

それ以外の場合は、ランダム シードによってシードされます。

デフォルトは 0

シード2

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed2(
  int64 x
)

シードの衝突を避けるための 2 番目のシード。

デフォルトは 0

シャード

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Shard(
  int64 x
)

サンプラーを使用して、元の範囲のサブセットからサンプリングすることで、並列処理を通じて計算全体を高速化できます。

このパラメータは (「num_shards」と合わせて) パーティショニングが使用されている場合に、サンプラー オペレーションの特定のパーティション番号を示します。

デフォルトは 0

ユニグラム

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Unigrams(
  const gtl::ArraySlice< float > & x
)

ユニグラム数または確率のリスト。ID ごとに 1 つずつ、順番に並べられます。

vocab_file と unigrams のうちの 1 つだけをこの操作に渡す必要があります。

デフォルトは []

語彙ファイル

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::VocabFile(
  StringPiece x
)

このファイル (CSV のような形式である必要があります) 内の各有効な行は、有効な単語 ID に対応します。

ID は num_reserved_ids から始まる順番です。各行の最後のエントリは、カウントまたは相対確率に対応する値であることが期待されます。 vocab_file と unigrams の 1 つだけをこの操作に渡す必要があります。

デフォルトは「」です