CudnnRNNV3

publiczna klasa końcowa CudnnRNNV3

RNN wspierany przez cuDNN.

Oblicza RNN na podstawie stanów wejściowych i początkowych w odniesieniu do bufora parametrów. Akceptuje jedno dodatkowe wejście „długości_sekwencji” niż CudnnRNN.

rnn_mode: Wskazuje typ modelu RNN. input_mode: Wskazuje, czy istnieje projekcja liniowa pomiędzy danymi wejściowymi a rzeczywistym obliczeniem przed pierwszą warstwą. „skip_input” jest dozwolone tylko wtedy, gdy input_size == num_units; „auto_select” oznacza „skip_input”, gdy input_size == liczba_jednostek; w przeciwnym razie oznacza to „wejście liniowe”. kierunek: wskazuje, czy będzie używany model dwukierunkowy. Powinien być „jednokierunkowy” lub „dwukierunkowy”. rezygnacja: prawdopodobieństwo rezygnacji. Po ustawieniu na 0, odrzucanie jest wyłączone. nasiono: Pierwsza część materiału siewnego inicjująca porzucenie. nasiono2: Druga część materiału siewnego inicjująca porzucenie. dane wejściowe: Jeśli wartość time_major ma wartość true, jest to tensor 3-D o kształcie [długość_sekwencji, rozmiar_wsadu, rozmiar_wejściowy]. Jeśli time_major ma wartość false, kształt to [batch_size, seq_length, input_size]. input_h: Jeśli time_major ma wartość true, jest to tensor 3-D o kształcie [num_layer * dir,bat_size, num_units]. Jeśli time_major ma wartość false, kształt to [batch_size, num_layer * dir, num_units]. input_c: W przypadku LSTM: tensor 3-D o kształcie [num_layer * dir, wsad, liczba_jednostek]. W przypadku innych modeli jest on ignorowany. params: Tensor 1-D zawierający wagi i odchylenia w nieprzezroczystym układzie. Rozmiar należy utworzyć za pomocą CudnnRNNParamsSize i zainicjować osobno. Należy pamiętać, że mogą one nie być kompatybilne w przypadku różnych generacji. Dlatego dobrym pomysłem jest zapisanie i przywrócenie długości_sekwencji: wektora długości każdej sekwencji wejściowej. wynik: Jeśli wartość time_major ma wartość true, jest to tensor 3-D o kształcie [długość_sekwencji, rozmiar_partia, katalog * liczba_jednostek]. Jeśli time_major ma wartość false, kształt to [batch_size, seq_length, dir * liczba_jednostek]. wyjście_h: Ten sam kształt ma wejście_h. wyjście_c: Taki sam kształt jak wejście_c dla LSTM. Pusty tensor dla innych modeli. is_training: wskazuje, czy ta operacja jest używana do wnioskowania, czy do szkolenia. time_major: Wskazuje, czy format wejścia/wyjścia jest formatem głównym czasowym, czy głównym formatem wsadowym. rezerwa_space: Nieprzezroczysty tensor, którego można użyć w obliczeniach podpór. Jest generowany tylko wtedy, gdy is_training ma wartość true.

Klasy zagnieżdżone

klasa CudnnRNNV3.Opcje Opcjonalne atrybuty dla CudnnRNNV3

Metody publiczne

statyczny <T numer rozszerzenia> CudnnRNNV3 <T>
utwórz (zakres zakresu , argument <T> wejście, argument <T> wejścieH, argument <T> wejścieC, parametry argumentu <T>, argument <liczba całkowita> długość sekwencji, opcje... opcje)
Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację CudnnRNNV3.
statyczne CudnnRNNV3.Opcje
kierunek (kierunek struny)
statyczne CudnnRNNV3.Opcje
porzucenie (odrzucenie pływające)
Wyjście <?>
statyczne CudnnRNNV3.Opcje
inputMode (ciąg wejściowyMode)
statyczne CudnnRNNV3.Opcje
isTraining (wartość logiczna isTraining)
statyczne CudnnRNNV3.Opcje
numProj (długie numProj)
Wyjście <T>
Wyjście <T>
Wyjście <T>
Wyjście <T>
statyczne CudnnRNNV3.Opcje
rnnMode (Ciąg rnnMode)
statyczne CudnnRNNV3.Opcje
nasiona (długie nasiona)
statyczne CudnnRNNV3.Opcje
nasiona 2 (Długie nasiona 2)
statyczne CudnnRNNV3.Opcje
timeMajor (wartość logiczna timeMajor)

Metody dziedziczone

Metody publiczne

public static CudnnRNNV3 <T> create (zakres zakresu , argument <T> wejście, argument <T> wejścieH, argument <T> wejścieC, parametry argumentu <T>, argument < liczba całkowita> długość sekwencji, opcje... opcje)

Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację CudnnRNNV3.

Parametry
zakres aktualny zakres
opcje przenosi opcjonalne wartości atrybutów
Zwroty
  • nowa instancja CudnnRNNV3

publiczny statyczny kierunek CudnnRNNV3.Options (kierunek ciągu)

public static rezygnacja z CudnnRNNV3.Options (rezygnacja z funkcji Float)

publiczne dane wyjściowe <?> hostReserved ()

public static CudnnRNNV3.Options inputMode (String inputMode)

public static CudnnRNNV3.Options isTraining (Boolean isTraining)

publiczny statyczny CudnnRNNV3.Options numProj (Long numProj)

publiczne wyjście <T> wyjście ()

publiczne wyjście <T> wyjścieC ()

publiczne Wyjście <T> wyjścieH ()

publiczne wyjście <T> ReserveSpace ()

public static CudnnRNNV3.Options rnnMode (String rnnMode)

public static CudnnRNNV3.Options nasiono (długie ziarno)

public static CudnnRNNV3.Options nasiono2 (długie ziarno2)

public static CudnnRNNV3.Options timeMajor (Boolean timeMajor)