clase final pública BlockLSTMGrad
Calcula la propagación hacia atrás de la celda LSTM para toda la secuencia de tiempo.
Esta implementación se utilizará junto con LSTMBlock.
Métodos públicos
Salida <T> | bGrad () El gradiente de w se apoyará hacia atrás. |
estático <T extiende Número> Bloque LSTMGrad <T> | create ( alcance de alcance, operando <Long> seqLenMax, operando <T> x, operando <T> csPrev, operando <T> hPrev, operando <T> w, operando <T> wci, operando <T> wcf, operando <T > wco, operando <T> b, operando <T> i, operando <T> cs, operando <T> f, operando <T> o, operando <T> ci, operando <T> co, operando <T> h , Operando <T> csGrad, Operando <T> hGrad, Uso booleano Mirilla) Método de fábrica para crear una clase que envuelva una nueva operación BlockLSTMGrad. |
Salida <T> | csPrevGrad () El gradiente de cs_prev que se respaldará. |
Salida <T> | hPrevGrad () El gradiente de h_prev que se respaldará. |
Salida <T> | wGrad () El gradiente de w se apoyará hacia atrás. |
Salida <T> | wcfGrad () El gradiente para que el wcf esté apoyado hacia atrás. |
Salida <T> | wciGrad () El gradiente para que wci se apoye hacia atrás. |
Salida <T> | wcoGrad () El gradiente para que wco sea apoyado hacia atrás. |
Salida <T> | xGrad () El gradiente de x que se apoyará hacia atrás. |
Métodos heredados
Métodos públicos
public static BlockLSTMGrad <T> crear ( Alcance alcance, operando <Larga> seqLenMax, operando <T> x, operando <T> csPrev, operando <T> hPrev, operando <T> w, operando <T> WCI, operando <T > wcf, operando <T> wco, operando <T> b, operando <T> i, operando <T> cs, operando <T> f, operando <T> o, operando <T> ci, operando <T> co , Operando <T> h, operando <T> csGrad, operando <T> hGrad, uso booleano
Método de fábrica para crear una clase que envuelva una nueva operación BlockLSTMGrad.
Parámetros
alcance | alcance actual |
---|---|
seqLenMax | Duración máxima de tiempo realmente utilizada por esta entrada. Las salidas se rellenan con ceros más allá de esta longitud. |
X | La secuencia de entrada al LSTM, forma (timelen, batch_size, num_inputs). |
csPrev | Valor del estado inicial de la celda. |
hPrev | Salida inicial de celda (para ser utilizada como mirilla). |
w | La matriz de peso. |
wci | La matriz de peso para la conexión de mirilla de la puerta de entrada. |
WC | La matriz de peso para la conexión de mirilla de puerta olvidada. |
wco | La matriz de peso para la conexión de mirilla de la puerta de salida. |
B | El vector de sesgo. |
I | La puerta de entrada en toda la secuencia de tiempo. |
cs | El estado de la celda antes del tanh durante toda la secuencia de tiempo. |
F | La puerta del olvido en toda la secuencia de tiempo. |
o | La puerta de salida en toda la secuencia de tiempo. |
ci | La entrada de la celda durante toda la secuencia de tiempo. |
co | La celda después del tanh durante toda la secuencia de tiempo. |
h | El vector de salida h en toda la secuencia de tiempo. |
csGrad | El gradiente actual de cs. |
hGrad | El gradiente del vector h. |
utilizar Mirilla | Ya sea para usar pesas de mirilla. |
Devoluciones
- una nueva instancia de BlockLSTMGrad