टेंसरफ़्लो :: ऑप्स :: फिक्स्डनिग्रामक्रमैडेटसैंपलर :: संलग्न करता है
#include <candidate_sampling_ops.h>
वैकल्पिक विशेषता FixedUnigramCandidateSampler के लिए बसती है ।
सारांश
सार्वजनिक विशेषताएँ | |
---|---|
distortion_ = 1.0f | float |
num_reserved_ids_ = 0 | int64 |
num_shards_ = 1 | int64 |
seed2_ = 0 | int64 |
seed_ = 0 | int64 |
shard_ = 0 | int64 |
unigrams_ = {} | gtl::ArraySlice< float > |
vocab_file_ = "" | StringPiece |
सार्वजनिक कार्य | |
---|---|
Distortion (float x) | TF_MUST_USE_RESULT Attrs विकृति का उपयोग यूनीग्राम संभाव्यता वितरण को तिरछा करने के लिए किया जाता है। |
NumReservedIds (int64 x) | TF_MUST_USE_RESULT Attrs वैकल्पिक रूप से कुछ आरक्षित आईडी को उपयोगकर्ताओं द्वारा [0, ..., num_reserved_ids] श्रेणी में जोड़ा जा सकता है। |
NumShards (int64 x) | TF_MUST_USE_RESULT Attrs समतुल्यता के माध्यम से संपूर्ण गणना को गति देने के लिए मूल रेंज के सबसेट से नमूने के लिए नमूना का उपयोग किया जा सकता है। |
Seed (int64 x) | TF_MUST_USE_RESULT Attrs यदि या तो बीज या बीज 2 को गैर-शून्य पर सेट किया जाता है, तो यादृच्छिक संख्या जनरेटर को दिए गए बीज द्वारा बीज दिया जाता है। |
Seed2 (int64 x) | TF_MUST_USE_RESULT Attrs बीज टकराने से बचने के लिए एक दूसरा बीज। |
Shard (int64 x) | TF_MUST_USE_RESULT Attrs समतुल्यता के माध्यम से संपूर्ण गणना को गति देने के लिए मूल रेंज के सबसेट से नमूने के लिए नमूना का उपयोग किया जा सकता है। |
Unigrams (const gtl::ArraySlice< float > & x) | TF_MUST_USE_RESULT Attrs यूनीग्राम की सूची या संभाव्यता, क्रमबद्ध क्रम में एक आईडी प्रति। |
VocabFile (StringPiece x) | TF_MUST_USE_RESULT Attrs इस फ़ाइल में प्रत्येक वैध पंक्ति (जिसमें CSV जैसा प्रारूप होना चाहिए) एक मान्य शब्द आईडी से मेल खाती है। |
सार्वजनिक विशेषताएँ
विरूपण_
float tensorflow::ops::FixedUnigramCandidateSampler::Attrs::distortion_ = 1.0f
num_reserved_ids_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_reserved_ids_ = 0
num_shards_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_shards_ = 1
बीज 2_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed2_ = 0
बीज_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed_ = 0
शार्क_
int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::shard_ = 0
unigrams_
gtl::ArraySlice< float > tensorflow::ops::FixedUnigramCandidateSampler::Attrs::unigrams_ = {}
vocab_file_
StringPiece tensorflow::ops::FixedUnigramCandidateSampler::Attrs::vocab_file_ = ""
सार्वजनिक कार्य
विरूपण
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Distortion( float x )
विकृति का उपयोग यूनीग्राम संभाव्यता वितरण को तिरछा करने के लिए किया जाता है।
आंतरिक यूनीग्राम वितरण में जोड़ने से पहले विकृति की शक्ति के लिए प्रत्येक वजन उठाया जाता है। नतीजतन, विकृति = 1.0 नियमित यूनीग्राम नमूना देता है (जैसा कि शब्दचित्र फ़ाइल द्वारा परिभाषित किया गया है), और विरूपण = 0.0 एक समान वितरण देता है।
1 से चूक
NumReservedIds
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumReservedIds( int64 x )
वैकल्पिक रूप से कुछ आरक्षित आईडी को उपयोगकर्ताओं द्वारा [0, ..., num_reserved_ids] श्रेणी में जोड़ा जा सकता है।
एक उपयोग मामला यह है कि एक विशेष अज्ञात शब्द टोकन का उपयोग आईडी 0 के रूप में किया जाता है। इन आईडी में 0 की नमूना संभावना होगी।
चूक ०
नम्बरदार
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumShards( int64 x )
समतुल्यता के माध्यम से संपूर्ण गणना को गति देने के लिए मूल रेंज के सबसेट से नमूने के लिए नमूना का उपयोग किया जा सकता है।
यह पैरामीटर ('शार्द' के साथ) कुल विभाजन में उपयोग किए जा रहे विभाजन की संख्या को इंगित करता है।
1 से चूक
बीज
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed( int64 x )
यदि या तो बीज या बीज 2 को गैर-शून्य पर सेट किया जाता है, तो यादृच्छिक संख्या जनरेटर को दिए गए बीज द्वारा बीज दिया जाता है।
अन्यथा, यह एक यादृच्छिक बीज द्वारा बोया जाता है।
चूक ०
बीज २
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed2( int64 x )
बीज टकराने से बचने के लिए एक दूसरा बीज।
चूक ०
ठीकरा
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Shard( int64 x )
समतुल्यता के माध्यम से संपूर्ण गणना को गति देने के लिए मूल रेंज के सबसेट से नमूने के लिए एक नमूना का उपयोग किया जा सकता है।
यह पैरामीटर ('num_shards' के साथ) एक नमूना ऑप के विशेष विभाजन संख्या को इंगित करता है, जब विभाजन का उपयोग किया जा रहा हो।
चूक ०
यूनीग्राम
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Unigrams( const gtl::ArraySlice< float > & x )
यूनीग्राम की सूची या संभाव्यता, क्रमबद्ध क्रम में एक आईडी प्रति।
वास्तव में इस ऑप से कोई भी शब्द vabab_file और unigrams पास होना चाहिए।
चूक []
VocabFile
TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::VocabFile( StringPiece x )
इस फ़ाइल में प्रत्येक वैध पंक्ति (जिसमें CSV जैसा प्रारूप होना चाहिए) एक मान्य शब्द आईडी से मेल खाती है।
ID अनुक्रमिक क्रम में हैं, num_reserved_ids से शुरू। प्रत्येक पंक्ति में अंतिम प्रविष्टि को गणना या सापेक्ष संभावना के अनुरूप मान होने की उम्मीद है। वास्तव में इस ऑप को पास करने की जरूरत है।
"" के लिए चूक