BlockLSTMGradV2

classe finale pubblica BlockLSTMGradV2

Calcola la propagazione all'indietro della cella LSTM per l'intera sequenza temporale.

Questa implementazione deve essere utilizzata insieme a BlockLSTMV2.

Metodi pubblici

Uscita <T>
bGrado ()
Il gradiente per w da sostenere all'indietro.
statico <T estende il numero> BlockLSTMGradV2 <T>
create ( Ambito ambito , Operando <Long> seqLenMax, Operando <T> x, Operando <T> csPrev, Operando <T> hPrev, Operando <T> w, Operando <T> wci, Operando <T> wcf, Operando <T > wco, Operando <T> b, Operando <T> i, Operando <T> cs, Operando <T> f, Operando <T> o, Operando <T> ci, Operando <T> co, Operando <T> h , Operando <T> csGrad, Operando <T> hGrad, uso booleanoSpecchio)
Metodo factory per creare una classe che racchiude una nuova operazione BlockLSTMGradV2.
Uscita <T>
csPrevGrad ()
Il gradiente di cs_prev da sostenere all'indietro.
Uscita <T>
hPrevGrad ()
Il gradiente di h_prev da sostenere all'indietro.
Uscita <T>
wGrado ()
Il gradiente per w da sostenere all'indietro.
Uscita <T>
wcfGrad ()
Il gradiente per il wcf da sostenere all'indietro.
Uscita <T>
wciGrad ()
Il gradiente per wci da sostenere all'indietro.
Uscita <T>
wcoGrad ()
Il gradiente per il wco da sostenere all'indietro.
Uscita <T>
xGrado ()
Il gradiente di x da sostenere all'indietro.

Metodi ereditati

Metodi pubblici

Uscita pubblica <T> bGrad ()

Il gradiente per w da sostenere all'indietro.

public static BlockLSTMGradV2 <T> create ( Ambito ambito , Operando <Long> seqLenMax, Operando <T> x, Operando <T> csPrev, Operando <T> hPrev, Operando <T> w, Operando <T> wci, Operando <T > wcf, Operando <T> wco, Operando <T> b, Operando <T> i, Operando <T> cs, Operando <T> f, Operando <T> o, Operando <T> ci, Operando <T> co , Operando <T> h, Operando <T> csGrad, Operando <T> hGrad, uso booleano Spioncino)

Metodo factory per creare una classe che racchiude una nuova operazione BlockLSTMGradV2.

Parametri
scopo ambito attuale
seqLenMax Durata massima effettivamente utilizzata da questo input. Le uscite vengono riempite con zeri oltre questa lunghezza.
X L'input della sequenza in LSTM, forma (timelen, batch_size, num_inputs).
csPrec Valore dello stato iniziale della cella.
hPrec Output iniziale della cella (da utilizzare per lo spioncino).
w La matrice dei pesi.
wci La matrice dei pesi per la connessione dello spioncino del cancello di ingresso.
wcf La matrice dei pesi per la connessione dello spioncino del dimenticatoio.
wco La matrice dei pesi per la connessione dello spioncino del cancello di uscita.
B Il vettore di polarizzazione.
io Il gate di ingresso sull'intera sequenza temporale.
c.s Lo stato della cella prima del tanh durante l'intera sequenza temporale.
F La porta dell'oblio su tutta la sequenza temporale.
o Il gate di uscita sull'intera sequenza temporale.
ci L'input della cella durante l'intera sequenza temporale.
co La cella dopo l'abbronzatura durante l'intera sequenza temporale.
H Il vettore h di uscita sull'intera sequenza temporale.
csGrad Il gradiente attuale di cs.
hGrad Il gradiente del vettore h.
utilizzare Spioncino Se utilizzare i pesi dello spioncino.
ritorna
  • una nuova istanza di BlockLSTMGradV2

Output pubblico <T> csPrevGrad ()

Il gradiente di cs_prev da sostenere all'indietro.

Output pubblico <T> hPrevGrad ()

Il gradiente di h_prev da sostenere all'indietro.

Uscita pubblica <T> wGrad ()

Il gradiente per w da sostenere all'indietro.

Uscita pubblica <T> wcfGrad ()

Il gradiente per il wcf da sostenere all'indietro.

Uscita pubblica <T> wciGrad ()

Il gradiente per wci da sostenere all'indietro.

Uscita pubblica <T> wcoGrad ()

Il gradiente per il wco da sostenere all'indietro.

Uscita pubblica <T> xGrad ()

Il gradiente di x da sostenere all'indietro.