BlockLSTMGradV2

Clase public final BlockLSTMGradV2

Calcula la propagación hacia atrás de la celda LSTM para toda la secuencia de tiempo.

Esta implementación se utilizará junto con BlockLSTMV2.

Métodos públicos

Salida <T>
bgrad ()
El gradiente de w se apoyará hacia atrás.
estática <T se extiende Número> BlockLSTMGradV2 <T>
crear ( Alcance alcance, operando <largo> seqLenMax, operando <T> x, operando <T> csPrev, operando <T> hPrev, operando <T> w, operando <T> wci, operando <T> WCF, operando <T > OMA, operando <T> b, operando <T> i, operando <T> cs, operando <T> f, operando <T> O, operando <T> ci, operando <T> co, operando <T> h , operando <T> csGrad, operando <T> hGrad, Boolean usePeephole)
Método de fábrica para crear una clase que envuelva una nueva operación BlockLSTMGradV2.
Salida <T>
csPrevGrad ()
El gradiente de cs_prev que se respaldará.
Salida <T>
hPrevGrad ()
El gradiente de h_prev que se respaldará.
Salida <T>
wGrad ()
El gradiente de w se apoyará hacia atrás.
Salida <T>
wcfGrad ()
El gradiente para que el wcf esté apoyado hacia atrás.
Salida <T>
wciGrad ()
El gradiente para que wci se apoye hacia atrás.
Salida <T>
wcoGrad ()
El gradiente para que wco sea apoyado hacia atrás.
Salida <T>
xGrad ()
El gradiente de x que se apoyará hacia atrás.

Métodos heredados

Métodos públicos

pública de salida <T> bgrad ()

El gradiente de w se apoyará hacia atrás.

public static BlockLSTMGradV2 <T> crear ( Alcance alcance, operando <Larga> seqLenMax, operando <T> x, operando <T> csPrev, operando <T> hPrev, operando <T> w, operando <T> WCI, operando <T > WCF, operando <T> OMA, operando <T> b, operando <T> i, operando <T> cs, operando <T> f, operando <T> O, operando <T> ci, operando <T> co , operando <T> h, operando <T> csGrad, operando <T> hGrad, Boolean usePeephole)

Método de fábrica para crear una clase que envuelva una nueva operación BlockLSTMGradV2.

Parámetros
alcance alcance actual
seqLenMax Duración máxima de tiempo realmente utilizada por esta entrada. Las salidas se rellenan con ceros más allá de esta longitud.
X La secuencia de entrada al LSTM, forma (timelen, batch_size, num_inputs).
csPrev Valor del estado inicial de la celda.
hPrev Salida inicial de celda (para ser utilizada como mirilla).
w La matriz de peso.
wci La matriz de peso para la conexión de mirilla de la puerta de entrada.
WC La matriz de peso para la conexión de mirilla de puerta olvidada.
wco La matriz de peso para la conexión de mirilla de la puerta de salida.
B El vector de sesgo.
I La puerta de entrada en toda la secuencia de tiempo.
cs El estado de la celda antes del tanh durante toda la secuencia de tiempo.
F La puerta del olvido en toda la secuencia de tiempo.
o La puerta de salida en toda la secuencia de tiempo.
ci La entrada de la celda durante toda la secuencia de tiempo.
co La celda después del tanh durante toda la secuencia de tiempo.
h El vector de salida h en toda la secuencia de tiempo.
csGrad El gradiente actual de cs.
hGrad El gradiente del vector h.
utilizar mirilla Ya sea para usar pesas de mirilla.
Devoluciones
  • una nueva instancia de BlockLSTMGradV2

pública de salida <T> csPrevGrad ()

El gradiente de cs_prev que se respaldará.

pública de salida <T> hPrevGrad ()

El gradiente de h_prev que se respaldará.

pública de salida <T> wGrad ()

El gradiente de w se apoyará hacia atrás.

pública de salida <T> wcfGrad ()

El gradiente para que el wcf esté apoyado hacia atrás.

pública de salida <T> wciGrad ()

El gradiente para que wci se apoye hacia atrás.

pública de salida <T> wcoGrad ()

El gradiente para que wco sea apoyado hacia atrás.

pública de salida <T> xGrad ()

El gradiente de x que se apoyará hacia atrás.