clase final pública BlockLSTMGrad
Calcula la propagación hacia atrás de la celda LSTM para toda la secuencia de tiempo.
Esta implementación se utilizará junto con LSTMBlock.
Métodos públicos
| Salida <T> | bGrad () El gradiente de w se apoyará hacia atrás. |
| estático <T extiende Número> Bloque LSTMGrad <T> | create ( alcance de alcance, operando <Long> seqLenMax, operando <T> x, operando <T> csPrev, operando <T> hPrev, operando <T> w, operando <T> wci, operando <T> wcf, operando <T > wco, operando <T> b, operando <T> i, operando <T> cs, operando <T> f, operando <T> o, operando <T> ci, operando <T> co, operando <T> h , Operando <T> csGrad, Operando <T> hGrad, Uso booleano Mirilla) Método de fábrica para crear una clase que envuelva una nueva operación BlockLSTMGrad. |
| Salida <T> | csPrevGrad () El gradiente de cs_prev que se respaldará. |
| Salida <T> | hPrevGrad () El gradiente de h_prev que se respaldará. |
| Salida <T> | wGrad () El gradiente de w se apoyará hacia atrás. |
| Salida <T> | wcfGrad () El gradiente para que el wcf esté apoyado hacia atrás. |
| Salida <T> | wciGrad () El gradiente para que wci se apoye hacia atrás. |
| Salida <T> | wcoGrad () El gradiente para que wco sea apoyado hacia atrás. |
| Salida <T> | xGrad () El gradiente de x que se apoyará hacia atrás. |
Métodos heredados
Métodos públicos
public static BlockLSTMGrad <T> crear ( Alcance alcance, operando <Larga> seqLenMax, operando <T> x, operando <T> csPrev, operando <T> hPrev, operando <T> w, operando <T> WCI, operando <T > wcf, operando <T> wco, operando <T> b, operando <T> i, operando <T> cs, operando <T> f, operando <T> o, operando <T> ci, operando <T> co , Operando <T> h, operando <T> csGrad, operando <T> hGrad, uso booleano
Método de fábrica para crear una clase que envuelva una nueva operación BlockLSTMGrad.
Parámetros
| alcance | alcance actual |
|---|---|
| seqLenMax | Duración máxima de tiempo realmente utilizada por esta entrada. Las salidas se rellenan con ceros más allá de esta longitud. |
| X | La secuencia de entrada al LSTM, forma (timelen, batch_size, num_inputs). |
| csPrev | Valor del estado inicial de la celda. |
| hPrev | Salida inicial de celda (para ser utilizada como mirilla). |
| w | La matriz de peso. |
| wci | La matriz de peso para la conexión de mirilla de la puerta de entrada. |
| WC | La matriz de peso para la conexión de mirilla de puerta olvidada. |
| wco | La matriz de peso para la conexión de mirilla de la puerta de salida. |
| B | El vector de sesgo. |
| I | La puerta de entrada en toda la secuencia de tiempo. |
| cs | El estado de la celda antes del tanh durante toda la secuencia de tiempo. |
| F | La puerta del olvido en toda la secuencia de tiempo. |
| o | La puerta de salida en toda la secuencia de tiempo. |
| ci | La entrada de la celda durante toda la secuencia de tiempo. |
| co | La celda después del tanh durante toda la secuencia de tiempo. |
| h | El vector de salida h en toda la secuencia de tiempo. |
| csGrad | El gradiente actual de cs. |
| hGrad | El gradiente del vector h. |
| utilizar mirilla | Ya sea para usar pesas de mirilla. |
Devoluciones
- una nueva instancia de BlockLSTMGrad