BlockLSTMGrad

clase final pública BlockLSTMGrad

Calcula la propagación hacia atrás de la celda LSTM para toda la secuencia de tiempo.

Esta implementación se utilizará junto con LSTMBlock.

Métodos públicos

Salida <T>
bGrad ()
El gradiente de w se apoyará hacia atrás.
estático <T extiende Número> Bloque LSTMGrad <T>
create ( alcance de alcance, operando <Long> seqLenMax, operando <T> x, operando <T> csPrev, operando <T> hPrev, operando <T> w, operando <T> wci, operando <T> wcf, operando <T > wco, operando <T> b, operando <T> i, operando <T> cs, operando <T> f, operando <T> o, operando <T> ci, operando <T> co, operando <T> h , Operando <T> csGrad, Operando <T> hGrad, Uso booleano Mirilla)
Método de fábrica para crear una clase que envuelva una nueva operación BlockLSTMGrad.
Salida <T>
csPrevGrad ()
El gradiente de cs_prev que se respaldará.
Salida <T>
hPrevGrad ()
El gradiente de h_prev que se respaldará.
Salida <T>
wGrad ()
El gradiente de w se apoyará hacia atrás.
Salida <T>
wcfGrad ()
El gradiente para que el wcf esté apoyado hacia atrás.
Salida <T>
wciGrad ()
El gradiente para que wci se apoye hacia atrás.
Salida <T>
wcoGrad ()
El gradiente para que wco sea apoyado hacia atrás.
Salida <T>
xGrad ()
El gradiente de x que se apoyará hacia atrás.

Métodos heredados

Métodos públicos

Salida pública <T> bGrad ()

El gradiente de w se apoyará hacia atrás.

public static BlockLSTMGrad <T> crear ( Alcance alcance, operando <Larga> seqLenMax, operando <T> x, operando <T> csPrev, operando <T> hPrev, operando <T> w, operando <T> WCI, operando <T > wcf, operando <T> wco, operando <T> b, operando <T> i, operando <T> cs, operando <T> f, operando <T> o, operando <T> ci, operando <T> co , Operando <T> h, operando <T> csGrad, operando <T> hGrad, uso booleano

Método de fábrica para crear una clase que envuelva una nueva operación BlockLSTMGrad.

Parámetros
alcance alcance actual
seqLenMax Duración máxima de tiempo realmente utilizada por esta entrada. Las salidas se rellenan con ceros más allá de esta longitud.
X La secuencia de entrada al LSTM, forma (timelen, batch_size, num_inputs).
csPrev Valor del estado inicial de la celda.
hPrev Salida inicial de celda (para ser utilizada como mirilla).
w La matriz de peso.
wci La matriz de peso para la conexión de mirilla de la puerta de entrada.
WC La matriz de peso para la conexión de mirilla de puerta olvidada.
wco La matriz de peso para la conexión de mirilla de la puerta de salida.
B El vector de sesgo.
I La puerta de entrada en toda la secuencia de tiempo.
cs El estado de la celda antes del tanh durante toda la secuencia de tiempo.
F La puerta del olvido en toda la secuencia de tiempo.
o La puerta de salida en toda la secuencia de tiempo.
ci La entrada de la celda durante toda la secuencia de tiempo.
co La celda después del tanh durante toda la secuencia de tiempo.
h El vector de salida h en toda la secuencia de tiempo.
csGrad El gradiente actual de cs.
hGrad El gradiente del vector h.
utilizar mirilla Ya sea para usar pesas de mirilla.
Devoluciones
  • una nueva instancia de BlockLSTMGrad

Salida pública <T> csPrevGrad ()

El gradiente de cs_prev que se respaldará.

Salida pública <T> hPrevGrad ()

El gradiente de h_prev que se respaldará.

Salida pública <T> wGrad ()

El gradiente de w se apoyará hacia atrás.

Salida pública <T> wcfGrad ()

El gradiente para que el wcf esté apoyado hacia atrás.

Salida pública <T> wciGrad ()

El gradiente para que wci se apoye hacia atrás.

Salida pública <T> wcoGrad ()

El gradiente para que wco sea apoyado hacia atrás.

Salida pública <T> xGrad ()

El gradiente de x que se apoyará hacia atrás.