सीयूडीएनएन द्वारा समर्थित एक आरएनएन।
पैरामीटर बफर के संबंध में इनपुट और प्रारंभिक राज्यों से आरएनएन की गणना करता है। CudnnRNN की तुलना में एक अतिरिक्त इनपुट "sequence_lengths" स्वीकार करता है।
rnn_mode: आरएनएन मॉडल के प्रकार को इंगित करता है। input_mode: इंगित करता है कि पहली परत से पहले इनपुट और वास्तविक गणना के बीच एक रैखिक प्रक्षेपण है या नहीं। 'स्किप_इनपुट' की अनुमति केवल तभी दी जाती है जब input_size == num_units; 'auto_select' का अर्थ है 'skip_input' जब input_size == num_units; अन्यथा, इसका तात्पर्य 'रैखिक_इनपुट' से है। दिशा: इंगित करता है कि क्या एक द्विदिश मॉडल का उपयोग किया जाएगा। "यूनिडायरेक्शनल" या "बिडायरेक्शनल" होना चाहिए। ड्रॉपआउट: ड्रॉपआउट संभावना। 0 पर सेट होने पर, ड्रॉपआउट अक्षम हो जाता है। बीज: एक बीज का पहला भाग ड्रॉपआउट आरंभ करने के लिए। Seed2: एक बीज का दूसरा भाग ड्रॉपआउट प्रारंभ करने के लिए। इनपुट: यदि टाइम_मेजर सत्य है, तो यह एक 3-डी टेंसर है जिसका आकार [seq_length, बैच_साइज़, इनपुट_साइज़] है। यदि time_major गलत है, तो आकार [बैच_साइज़, seq_length, input_size] है। input_h: यदि time_major सत्य है, तो यह [num_layer * dir, बैच_साइज़, num_units] के आकार का 3-डी टेंसर है। अगर time_major गलत है, तो आकार [बैच_साइज़, num_layer * dir, num_units] है। input_c: LSTM के लिए, [num_layer * dir, बैच, num_units] के आकार वाला 3-डी टेंसर। अन्य मॉडलों के लिए, इसे अनदेखा किया जाता है। पैराम्स: एक 1-डी टेंसर जिसमें एक अपारदर्शी लेआउट में भार और पूर्वाग्रह होते हैं। आकार CudnnRNNParamsSize के माध्यम से बनाया जाना चाहिए, और अलग से प्रारंभ किया जाना चाहिए। ध्यान दें कि वे विभिन्न पीढ़ियों में संगत नहीं हो सकते हैं। इसलिए अनुक्रम_लंबाई को सहेजना और पुनर्स्थापित करना एक अच्छा विचार है: प्रत्येक इनपुट अनुक्रम की लंबाई का एक वेक्टर। आउटपुट: यदि टाइम_मेजर सत्य है, तो यह एक 3-डी टेंसर है जिसका आकार [seq_length, बैच_साइज़, dir * num_units] है। अगर time_major गलत है, तो आकार [बैच_साइज़, seq_length, dir * num_units] है। output_h: एक ही आकार में input_h है। output_c: LSTM के लिए input_c के समान आकार। अन्य मॉडलों के लिए एक खाली टेंसर। is_training: इंगित करता है कि क्या यह ऑपरेशन अनुमान या प्रशिक्षण के लिए उपयोग किया जाता है। time_major: इंगित करता है कि इनपुट/आउटपुट प्रारूप टाइम मेजर है या बैच मेजर। रिजर्व_स्पेस: एक अपारदर्शी टेंसर जिसका उपयोग बैकप्रॉप गणना में किया जा सकता है। यह केवल तभी निर्मित होता है जब is_training सत्य हो।
नेस्टेड कक्षाएं
कक्षा | CudnnRNNV3.Options | के लिए वैकल्पिक विशेषताओं CudnnRNNV3 |
सार्वजनिक तरीके
स्थिर <टी संख्या फैली> CudnnRNNV3 <टी> | |
स्थिर CudnnRNNV3.Options | दिशा (स्ट्रिंग दिशा) |
स्थिर CudnnRNNV3.Options | छोड़ने वालों (फ्लोट छोड़ने वालों) |
आउटपुट <?> | hostReserved () |
स्थिर CudnnRNNV3.Options | inputMode (स्ट्रिंग inputMode) |
स्थिर CudnnRNNV3.Options | isTraining (बूलियन isTraining) |
स्थिर CudnnRNNV3.Options | numProj (लांग numProj) |
आउटपुट <टी> | उत्पादन () |
आउटपुट <टी> | outputC () |
आउटपुट <टी> | outputH () |
आउटपुट <टी> | reserveSpace () |
स्थिर CudnnRNNV3.Options | rnnMode (स्ट्रिंग rnnMode) |
स्थिर CudnnRNNV3.Options | बीज (लांग बीज) |
स्थिर CudnnRNNV3.Options | seed2 (लांग seed2) |
स्थिर CudnnRNNV3.Options | timeMajor (बूलियन timeMajor) |
विरासत में मिली विधियां
सार्वजनिक तरीके
सार्वजनिक स्थिर CudnnRNNV3 <टी> बनाने ( स्कोप गुंजाइश, ओपेरैंड <टी> इनपुट, ओपेरैंड <टी> inputH, ओपेरैंड <टी> inputC, ओपेरैंड <टी> पैरामीटर, ओपेरैंड <पूर्णांक> sequenceLengths, विकल्प ... विकल्प)
एक नया CudnnRNNV3 ऑपरेशन रैपिंग क्लास बनाने के लिए फ़ैक्टरी विधि।
मापदंडों
दायरा | वर्तमान दायरा |
---|---|
विकल्प | वैकल्पिक विशेषता मान रखता है |
रिटर्न
- CudnnRNNV3 का एक नया उदाहरण