CudnnRNNBackpropV3

classe finale publique CudnnRNNBackpropV3

Étape de backprop de CudnnRNNV3.

Calculez le backprop des données et des poids dans un RNN. Prend une entrée "sequence_lengths" supplémentaire par rapport à CudnnRNNBackprop.

rnn_mode : Indique le type du modèle RNN. input_mode : indique s'il existe une projection linéaire entre l'entrée et le calcul réel avant la première couche. 'skip_input' n'est autorisé que lorsque input_size == num_units ; 'auto_select' implique 'skip_input' lorsque input_size == num_units ; sinon, cela implique 'linear_input'. direction : Indique si un modèle bidirectionnel sera utilisé. Doit être « unidirectionnel » ou « bidirectionnel ». abandon : probabilité d'abandon. Lorsqu'il est défini sur 0, la suppression est désactivée. seed : La 1ère partie d'une graine pour initialiser l'abandon. seed2 : la 2ème partie d'une graine pour initialiser l'abandon. input : Si time_major est vrai, il s'agit d'un tenseur 3D avec la forme de [seq_length, batch_size, input_size]. Si time_major est faux, la forme est [batch_size, seq_length, input_size]. input_h : Si time_major est vrai, il s'agit d'un tenseur 3D avec la forme de [num_layer * dir, batch_size, num_units]. Si time_major est faux, la forme est [batch_size, num_layer * dir, num_units]. input_c : pour LSTM, un tenseur 3D avec la forme de [num_layer * dir, batch, num_units]. Pour les autres modèles, il est ignoré. params : un tenseur 1D qui contient les poids et les biais dans une présentation opaque. La taille doit être créée via CudnnRNNParamsSize et initialisée séparément. Notez qu’ils peuvent ne pas être compatibles entre différentes générations. C'est donc une bonne idée de sauvegarder et de restaurer séquence_lengths : un vecteur de longueurs de chaque séquence d'entrée. sortie : si time_major est vrai, il s'agit d'un tenseur 3D ayant la forme de [seq_length, batch_size, dir * num_units]. Si time_major est faux, la forme est [batch_size, seq_length, dir * num_units]. output_h : la même forme a input_h. output_c : la même forme que input_c pour LSTM. Un tenseur vide pour d'autres modèles. output_backprop : un tenseur 3D avec la même forme que la sortie lors de la passe avant. output_h_backprop : un tenseur 3D avec la même forme que output_h dans la passe avant. output_c_backprop : un tenseur 3D avec la même forme que output_c dans la passe avant. time_major : indique si le format d'entrée/sortie est majeur en temps ou majeur en lot. reserve_space : le même reserve_space produit lors de l'opération forward. input_backprop : Le backprop à saisir dans la passe avant. A la même forme que l'entrée. input_h_backprop : Le backprop à input_h dans la passe avant. A la même forme que input_h. input_c_backprop : Le backprop à input_c dans la passe avant. A la même forme que input_c. params_backprop : le backprop du tampon de paramètres lors de la passe avant. A la même forme que les paramètres.

Classes imbriquées

classe CudnnRNNBackpropV3.Options Attributs facultatifs pour CudnnRNNBackpropV3

Méthodes publiques

statique <T étend le nombre> CudnnRNNBackpropV3 <T>
créer ( Portée de la portée , Entrée de l' opérande <T>, Entrée de l'opérande <T> H, Entrée de l' opérande <T> C, Paramètres de l'opérande <T>, Longueurs de séquence de l'opérande <Integer>, Sortie de l'opérande <T>, Sortie de l'opérande <T> H, Opérande <T > sortieC, Opérande <T> sortieBackprop, Opérande <T> sortieHBackprop, Opérande <T> sortieCBackprop, Opérande <T> reserveSpace, Opérande <?> hostReserved, Options... options)
Méthode d'usine pour créer une classe encapsulant une nouvelle opération CudnnRNNBackpropV3.
statique CudnnRNNBackpropV3.Options
direction (direction de la chaîne)
statique CudnnRNNBackpropV3.Options
abandon (abandon flottant)
Sortie <T>
Sortie <T>
Sortie <T>
statique CudnnRNNBackpropV3.Options
inputMode (chaîne inputMode)
statique CudnnRNNBackpropV3.Options
numProj (numProj long)
Sortie <T>
statique CudnnRNNBackpropV3.Options
rnnMode (Chaîne rnnMode)
statique CudnnRNNBackpropV3.Options
graine (graine longue)
statique CudnnRNNBackpropV3.Options
graine2 (graine longue2)
statique CudnnRNNBackpropV3.Options
timeMajor (Booléen timeMajor)

Méthodes héritées

Méthodes publiques

public static CudnnRNNBackpropV3 <T> créer ( Portée de la portée , Entrée de l'opérande <T>, Entrée de l' opérande <T> H, Entrée de l'opérande <T> C, Paramètres de l'opérande <T>, Longueurs de séquence de l'opérande <Integer>, Sortie de l'opérande <T>, Opérande <T > sortieH, Opérande <T> sortieC, Opérande <T> sortieBackprop, Opérande <T> sortieHBackprop, Opérande <T> sortieCBackprop, Opérande <T> reserveSpace, Opérande <?> hostReserved, Options... options)

Méthode d'usine pour créer une classe encapsulant une nouvelle opération CudnnRNNBackpropV3.

Paramètres
portée portée actuelle
choix porte des valeurs d'attributs facultatifs
Retour
  • une nouvelle instance de CudnnRNNBackpropV3

direction statique publique CudnnRNNBackpropV3.Options (direction de la chaîne)

abandon public statique CudnnRNNBackpropV3.Options (abandon flottant)

sortie publique <T> inputBackprop ()

sortie publique <T> inputCBackprop ()

sortie publique <T> inputHBackprop ()

public statique CudnnRNNBackpropV3.Options inputMode (String inputMode)

public statique CudnnRNNBackpropV3.Options numProj (Long numProj)

sortie publique <T> paramsBackprop ()

public statique CudnnRNNBackpropV3.Options rnnMode (String rnnMode)

graine publique statique CudnnRNNBackpropV3.Options (graine longue)

public statique CudnnRNNBackpropV3.Options seed2 (Long seed2)

public static CudnnRNNBackpropV3.Options timeMajor (booléen timeMajor)