classe finale pubblica BlockLSTMGrad
Calcola la propagazione all'indietro della cella LSTM per l'intera sequenza temporale.
Questa implementazione deve essere utilizzata insieme a LSTMBlock.
Metodi pubblici
Uscita <T> | bGrado () Il gradiente per w da sostenere all'indietro. |
statico <T estende il numero> BlockLSTMGrad <T> | create ( Ambito ambito , Operando <Long> seqLenMax, Operando <T> x, Operando <T> csPrev, Operando <T> hPrev, Operando <T> w, Operando <T> wci, Operando <T> wcf, Operando <T > wco, Operando <T> b, Operando <T> i, Operando <T> cs, Operando <T> f, Operando <T> o, Operando <T> ci, Operando <T> co, Operando <T> h , Operando <T> csGrad, Operando <T> hGrad, uso booleanoSpecchio) Metodo factory per creare una classe che racchiude una nuova operazione BlockLSTMGrad. |
Uscita <T> | csPrevGrad () Il gradiente di cs_prev da sostenere all'indietro. |
Uscita <T> | hPrevGrad () Il gradiente di h_prev da sostenere all'indietro. |
Uscita <T> | wGrado () Il gradiente per w da sostenere all'indietro. |
Uscita <T> | wcfGrad () Il gradiente per il wcf da sostenere all'indietro. |
Uscita <T> | wciGrad () Il gradiente per wci da sostenere all'indietro. |
Uscita <T> | wcoGrad () Il gradiente per il wco da sostenere all'indietro. |
Uscita <T> | xGrado () Il gradiente di x da sostenere all'indietro. |
Metodi ereditati
Metodi pubblici
public static BlockLSTMGrad <T> create ( Ambito ambito , Operando <Long> seqLenMax, Operando <T> x, Operando <T> csPrev, Operando <T> hPrev, Operando <T> w, Operando <T> wci, Operando <T > wcf, Operando <T> wco, Operando <T> b, Operando <T> i, Operando <T> cs, Operando <T> f, Operando <T> o, Operando <T> ci, Operando <T> co , Operando <T> h, Operando <T> csGrad, Operando <T> hGrad, uso booleano Spioncino)
Metodo factory per creare una classe che racchiude una nuova operazione BlockLSTMGrad.
Parametri
scopo | ambito attuale |
---|---|
seqLenMax | Durata massima effettivamente utilizzata da questo input. Le uscite vengono riempite con zeri oltre questa lunghezza. |
X | L'input della sequenza in LSTM, forma (timelen, batch_size, num_inputs). |
csPrec | Valore dello stato iniziale della cella. |
hPrec | Output iniziale della cella (da utilizzare per lo spioncino). |
w | La matrice dei pesi. |
wci | La matrice dei pesi per la connessione dello spioncino del cancello di ingresso. |
wcf | La matrice dei pesi per la connessione dello spioncino del dimenticatoio. |
wco | La matrice dei pesi per la connessione dello spioncino del cancello di uscita. |
B | Il vettore di polarizzazione. |
io | Il gate di ingresso sull'intera sequenza temporale. |
c.s | Lo stato della cella prima del tanh durante l'intera sequenza temporale. |
F | La porta dell'oblio su tutta la sequenza temporale. |
o | Il gate di uscita sull'intera sequenza temporale. |
ci | L'input della cella durante l'intera sequenza temporale. |
co | La cella dopo l'abbronzatura durante l'intera sequenza temporale. |
H | Il vettore h di uscita sull'intera sequenza temporale. |
csGrad | Il gradiente attuale di cs. |
hGrad | Il gradiente del vettore h. |
utilizzare Spioncino | Se utilizzare i pesi dello spioncino. |
ritorna
- una nuova istanza di BlockLSTMGrad