टेंसरफ़्लो :: ऑप्स :: फिक्स्डनिग्रामक्रमैडेटसैंपलर :: संलग्न करता है

#include <candidate_sampling_ops.h>

वैकल्पिक विशेषता FixedUnigramCandidateSampler के लिए बसती है

सारांश

सार्वजनिक विशेषताएँ

distortion_ = 1.0f
float
num_reserved_ids_ = 0
int64
num_shards_ = 1
int64
seed2_ = 0
int64
seed_ = 0
int64
shard_ = 0
int64
unigrams_ = {}
gtl::ArraySlice< float >
vocab_file_ = ""
StringPiece

सार्वजनिक कार्य

Distortion (float x)
TF_MUST_USE_RESULT Attrs
विकृति का उपयोग यूनीग्राम संभाव्यता वितरण को तिरछा करने के लिए किया जाता है।
NumReservedIds (int64 x)
TF_MUST_USE_RESULT Attrs
वैकल्पिक रूप से कुछ आरक्षित आईडी को उपयोगकर्ताओं द्वारा [0, ..., num_reserved_ids] श्रेणी में जोड़ा जा सकता है।
NumShards (int64 x)
TF_MUST_USE_RESULT Attrs
समतुल्यता के माध्यम से संपूर्ण गणना को गति देने के लिए मूल रेंज के सबसेट से नमूने के लिए नमूना का उपयोग किया जा सकता है।
Seed (int64 x)
TF_MUST_USE_RESULT Attrs
यदि या तो बीज या बीज 2 को गैर-शून्य पर सेट किया जाता है, तो यादृच्छिक संख्या जनरेटर को दिए गए बीज द्वारा बीज दिया जाता है।
Seed2 (int64 x)
TF_MUST_USE_RESULT Attrs
बीज टकराने से बचने के लिए एक दूसरा बीज।
Shard (int64 x)
TF_MUST_USE_RESULT Attrs
समतुल्यता के माध्यम से संपूर्ण गणना को गति देने के लिए मूल रेंज के सबसेट से नमूने के लिए नमूना का उपयोग किया जा सकता है।
Unigrams (const gtl::ArraySlice< float > & x)
TF_MUST_USE_RESULT Attrs
यूनीग्राम की सूची या संभाव्यता, क्रमबद्ध क्रम में एक आईडी प्रति।
VocabFile (StringPiece x)
TF_MUST_USE_RESULT Attrs
इस फ़ाइल में प्रत्येक वैध पंक्ति (जिसमें CSV जैसा प्रारूप होना चाहिए) एक मान्य शब्द आईडी से मेल खाती है।

सार्वजनिक विशेषताएँ

विरूपण_

float tensorflow::ops::FixedUnigramCandidateSampler::Attrs::distortion_ = 1.0f

num_reserved_ids_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_reserved_ids_ = 0

num_shards_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_shards_ = 1

बीज 2_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed2_ = 0

बीज_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed_ = 0

शार्क_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::shard_ = 0

unigrams_

gtl::ArraySlice< float > tensorflow::ops::FixedUnigramCandidateSampler::Attrs::unigrams_ = {}

vocab_file_

StringPiece tensorflow::ops::FixedUnigramCandidateSampler::Attrs::vocab_file_ = ""

सार्वजनिक कार्य

विरूपण

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Distortion(
  float x
)

विकृति का उपयोग यूनीग्राम संभाव्यता वितरण को तिरछा करने के लिए किया जाता है।

आंतरिक यूनीग्राम वितरण में जोड़ने से पहले विकृति की शक्ति के लिए प्रत्येक वजन उठाया जाता है। नतीजतन, विकृति = 1.0 नियमित यूनीग्राम नमूना देता है (जैसा कि शब्दचित्र फ़ाइल द्वारा परिभाषित किया गया है), और विरूपण = 0.0 एक समान वितरण देता है।

1 से चूक

NumReservedIds

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumReservedIds(
  int64 x
)

वैकल्पिक रूप से कुछ आरक्षित आईडी को उपयोगकर्ताओं द्वारा [0, ..., num_reserved_ids] श्रेणी में जोड़ा जा सकता है।

एक उपयोग मामला यह है कि एक विशेष अज्ञात शब्द टोकन का उपयोग आईडी 0 के रूप में किया जाता है। इन आईडी में 0 की नमूना संभावना होगी।

चूक ०

नम्बरदार

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumShards(
  int64 x
)

समतुल्यता के माध्यम से संपूर्ण गणना को गति देने के लिए मूल रेंज के सबसेट से नमूने के लिए नमूना का उपयोग किया जा सकता है।

यह पैरामीटर ('शार्द' के साथ) कुल विभाजन में उपयोग किए जा रहे विभाजन की संख्या को इंगित करता है।

1 से चूक

बीज

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed(
  int64 x
)

यदि या तो बीज या बीज 2 को गैर-शून्य पर सेट किया जाता है, तो यादृच्छिक संख्या जनरेटर को दिए गए बीज द्वारा बीज दिया जाता है।

अन्यथा, यह एक यादृच्छिक बीज द्वारा बोया जाता है।

चूक ०

बीज २

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed2(
  int64 x
)

बीज टकराने से बचने के लिए एक दूसरा बीज।

चूक ०

ठीकरा

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Shard(
  int64 x
)

समतुल्यता के माध्यम से संपूर्ण गणना को गति देने के लिए मूल रेंज के सबसेट से नमूने के लिए एक नमूना का उपयोग किया जा सकता है।

यह पैरामीटर ('num_shards' के साथ) एक नमूना ऑप के विशेष विभाजन संख्या को इंगित करता है, जब विभाजन का उपयोग किया जा रहा हो।

चूक ०

यूनीग्राम

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Unigrams(
  const gtl::ArraySlice< float > & x
)

यूनीग्राम की सूची या संभाव्यता, क्रमबद्ध क्रम में एक आईडी प्रति।

वास्तव में इस ऑप से कोई भी शब्द vabab_file और unigrams पास होना चाहिए।

चूक []

VocabFile

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::VocabFile(
  StringPiece x
)

इस फ़ाइल में प्रत्येक वैध पंक्ति (जिसमें CSV जैसा प्रारूप होना चाहिए) एक मान्य शब्द आईडी से मेल खाती है।

ID अनुक्रमिक क्रम में हैं, num_reserved_ids से शुरू। प्रत्येक पंक्ति में अंतिम प्रविष्टि को गणना या सापेक्ष संभावना के अनुरूप मान होने की उम्मीद है। वास्तव में इस ऑप को पास करने की जरूरत है।

"" के लिए चूक