clase final pública BlockLSTMGrad
Calcula la propagación hacia atrás de la celda LSTM para toda la secuencia de tiempo.
Esta implementación se utilizará junto con LSTMBlock.
Métodos públicos
Salida <T> | bGraduado () El gradiente para w se apoyará hacia atrás. |
estático <T extiende Número> BlockLSTMGrad <T> | crear ( Alcance alcance, Operando <Long> seqLenMax, Operando <T> x, Operando <T> csPrev, Operando <T> hPrev, Operando <T> w, Operando <T> wci, Operando <T> wcf, Operando <T > wco, Operando <T> b, Operando <T> i, Operando <T> cs, Operando <T> f, Operando <T> o, Operando <T> ci, Operando <T> co, Operando <T> h , Operando <T> csGrad, Operando <T> hGrad, uso booleanoMirilla) Método de fábrica para crear una clase que envuelve una nueva operación BlockLSTMGrad. |
Salida <T> | csPrevGrad () El gradiente de cs_prev se apuntalará hacia atrás. |
Salida <T> | hPrevGrad () El gradiente de h_prev se apuntalará hacia atrás. |
Salida <T> | wGraduado () El gradiente para w se apoyará hacia atrás. |
Salida <T> | wcfGrad () El gradiente para que wcf se apoye hacia atrás. |
Salida <T> | wciGrad () El gradiente para que wci se apoye hacia atrás. |
Salida <T> | wcoGrad () El gradiente para wco será apuntalado hacia atrás. |
Salida <T> | xGrad () El gradiente de x que se va a apuntalar hacia atrás. |
Métodos heredados
Métodos públicos
público estático BlockLSTMGrad <T> crear ( Alcance alcance, Operando <Long> seqLenMax, Operando <T> x, Operando <T> csPrev, Operando <T> hPrev, Operando <T> w, Operando <T> wci, Operando <T > wcf, Operando <T> wco, Operando <T> b, Operando <T> i, Operando <T> cs, Operando <T> f, Operando <T> o, Operando <T> ci, Operando <T> co , Operando <T> h, Operando <T> csGrad, Operando <T> hGrad, uso booleanoMirilla)
Método de fábrica para crear una clase que envuelve una nueva operación BlockLSTMGrad.
Parámetros
alcance | alcance actual |
---|---|
seqLenMax | Duración máxima de tiempo realmente utilizada por esta entrada. Las salidas se rellenan con ceros más allá de esta longitud. |
X | La secuencia de entrada al LSTM, forma (timelen, tamaño de lote, num_inputs). |
csAnterior | Valor del estado inicial de la celda. |
hAnterior | Salida inicial de celda (para ser utilizada para mirilla). |
w | La matriz de peso. |
wci | La matriz de peso para la conexión de mirilla de puerta de entrada. |
wcf | La matriz de peso para olvidar la conexión de mirilla de puerta. |
OMA | La matriz de pesos para la conexión de mirilla de puerta de salida. |
b | El vector de sesgo. |
i | La puerta de entrada durante toda la secuencia de tiempo. |
cs | El estado de la celda antes del tanh durante toda la secuencia de tiempo. |
F | La puerta del olvido sobre toda la secuencia temporal. |
oh | La puerta de salida durante toda la secuencia de tiempo. |
ci | La entrada de celda durante toda la secuencia de tiempo. |
co | La celda después del tanh durante toda la secuencia de tiempo. |
h | El vector h de salida sobre toda la secuencia de tiempo. |
csGrad | El gradiente actual de cs. |
hgrad | El gradiente del vector h. |
utilizar mirilla | Si se deben utilizar pesas para mirilla. |
Devoluciones
- una nueva instancia de BlockLSTMGrad