BlockLSTMGrad

classe finale pubblica BlockLSTMGrad

Calcola la propagazione all'indietro della cella LSTM per l'intera sequenza temporale.

Questa implementazione deve essere utilizzata insieme a LSTMBlock.

Metodi pubblici

Uscita <T>
bGrado ()
Il gradiente per w da sostenere all'indietro.
statico <T estende il numero> BlockLSTMGrad <T>
create ( Ambito ambito , Operando <Long> seqLenMax, Operando <T> x, Operando <T> csPrev, Operando <T> hPrev, Operando <T> w, Operando <T> wci, Operando <T> wcf, Operando <T > wco, Operando <T> b, Operando <T> i, Operando <T> cs, Operando <T> f, Operando <T> o, Operando <T> ci, Operando <T> co, Operando <T> h , Operando <T> csGrad, Operando <T> hGrad, uso booleanoPeephole)
Metodo factory per creare una classe che racchiude una nuova operazione BlockLSTMGrad.
Uscita <T>
csPrevGrad ()
Il gradiente di cs_prev da sostenere all'indietro.
Uscita <T>
hPrevGrad ()
Il gradiente di h_prev da sostenere all'indietro.
Uscita <T>
wGrado ()
Il gradiente per w da sostenere all'indietro.
Uscita <T>
wcfGrad ()
Il gradiente per il wcf da sostenere all'indietro.
Uscita <T>
wciGrad ()
Il gradiente per wci da sostenere all'indietro.
Uscita <T>
wcoGrad ()
Il gradiente per il wco da sostenere all'indietro.
Uscita <T>
xGrado ()
Il gradiente di x da sostenere all'indietro.

Metodi ereditati

Metodi pubblici

Uscita pubblica <T> bGrad ()

Il gradiente per w da sostenere all'indietro.

public static BlockLSTMGrad <T> create ( Ambito ambito , Operando <Long> seqLenMax, Operando <T> x, Operando <T> csPrev, Operando <T> hPrev, Operando <T> w, Operando <T> wci, Operando <T > wcf, Operando <T> wco, Operando <T> b, Operando <T> i, Operando <T> cs, Operando <T> f, Operando <T> o, Operando <T> ci, Operando <T> co , Operando <T> h, Operando <T> csGrad, Operando <T> hGrad, uso booleano Spioncino)

Metodo factory per creare una classe che racchiude una nuova operazione BlockLSTMGrad.

Parametri
scopo ambito attuale
seqLenMax Durata massima effettivamente utilizzata da questo input. Le uscite vengono riempite con zeri oltre questa lunghezza.
X L'input della sequenza in LSTM, forma (timelen, batch_size, num_inputs).
csPrec Valore dello stato iniziale della cella.
hPrec Output iniziale della cella (da utilizzare per lo spioncino).
w La matrice dei pesi.
wci La matrice dei pesi per la connessione dello spioncino del cancello di ingresso.
wcf La matrice dei pesi per la connessione dello spioncino del cancello dimenticato.
wco La matrice dei pesi per la connessione dello spioncino del cancello di uscita.
B Il vettore di polarizzazione.
io Il gate di ingresso sull'intera sequenza temporale.
c.s Lo stato della cella prima del tanh durante l'intera sequenza temporale.
F La porta dell'oblio su tutta la sequenza temporale.
o Il gate di uscita sull'intera sequenza temporale.
ci L'input della cella durante l'intera sequenza temporale.
co La cella dopo l'abbronzatura durante l'intera sequenza temporale.
H Il vettore h di uscita sull'intera sequenza temporale.
csGrad Il gradiente attuale di cs.
hGrad Il gradiente del vettore h.
utilizzare Spioncino Se utilizzare i pesi dello spioncino.
ritorna
  • una nuova istanza di BlockLSTMGrad

Output pubblico <T> csPrevGrad ()

Il gradiente di cs_prev da sostenere all'indietro.

Output pubblico <T> hPrevGrad ()

Il gradiente di h_prev da sostenere all'indietro.

Uscita pubblica <T> wGrad ()

Il gradiente per w da sostenere all'indietro.

Uscita pubblica <T> wcfGrad ()

Il gradiente per il wcf da sostenere all'indietro.

Uscita pubblica <T> wciGrad ()

Il gradiente per wci da sostenere all'indietro.

Uscita pubblica <T> wcoGrad ()

Il gradiente per il wco da sostenere all'indietro.

Uscita pubblica <T> xGrad ()

Il gradiente di x da sostenere all'indietro.