Aprenda o que há de mais recente em aprendizado de máquina, IA generativa e muito mais no WiML Symposium 2023 Registre-se

Esta página foi traduzida pela API Cloud Translation.

GRUBlockCellGrad

classe final pública GRUBlockCellGrad

Calcula a retropropagação da célula GRU para 1 passo de tempo.

Args x: Entrada para a célula GRU. h_prev: Estado de entrada da célula GRU anterior. w_ru: Matriz de peso para o portão de reset e atualização. w_c: Matriz de peso para a porta de conexão da célula. b_ru: Vetor de polarização para a porta de reset e atualização. b_c: Vetor de polarização para a porta de conexão da célula. r: Saída da porta de reset. u: Saída do portão de atualização. c: Saída da porta de conexão da célula. d_h: Gradientes do h_new wrt para a função objetivo.

Retorna d_x: Gradientes de x wrt para função objetivo. d_h_prev: Gradientes do h wrt para função objetivo. d_c_bar Gradientes do c_bar wrt para função objetivo. d_r_bar_u_bar Gradientes de r_bar & u_bar wrt para função objetivo.

Este kernel op implementa as seguintes equações matemáticas:

Nota sobre a notação das variáveis:

A concatenação de a e b é representada por a_b O produto escalar por elementos de a e b é representado por ab O produto escalar por elementos é representado por \circ A multiplicação de matrizes é representada por *

Notas adicionais para maior clareza:

`w_ru` pode ser segmentado em 4 matrizes diferentes.

w_ru = [w_r_x w_u_x
         w_r_h_prev w_u_h_prev]

Da mesma forma, `w_c` pode ser segmentado em 2 matrizes diferentes.

w_c = [w_c_x w_c_h_prevr]

O mesmo vale para vieses.

b_ru = [b_ru_x b_ru_h]
 b_c = [b_c_x b_c_h]

Outra nota sobre a notação:

d_x = d_x_component_1 + d_x_component_2
 
 where d_x_component_1 = d_r_bar * w_r_x^T + d_u_bar * w_r_x^T
 and d_x_component_2 = d_c_bar * w_c_x^T
 
 d_h_prev = d_h_prev_component_1 + d_h_prevr \circ r + d_h \circ u
 where d_h_prev_componenet_1 = d_r_bar * w_r_h_prev^T + d_u_bar * w_r_h_prev^T

Matemática por trás dos Gradients abaixo:

d_c_bar = d_h \circ (1-u) \circ (1-c \circ c)
 d_u_bar = d_h \circ (h-c) \circ u \circ (1-u)
 
 d_r_bar_u_bar = [d_r_bar d_u_bar]
 
 [d_x_component_1 d_h_prev_component_1] = d_r_bar_u_bar * w_ru^T
 
 [d_x_component_2 d_h_prevr] = d_c_bar * w_c^T
 
 d_x = d_x_component_1 + d_x_component_2
 
 d_h_prev = d_h_prev_component_1 + d_h_prevr \circ r + u

cálculo abaixo é realizado no wrapper python para os Gradients (não no kernel do gradiente.)

d_w_ru = x_h_prevr^T * d_c_bar
 
 d_w_c = x_h_prev^T * d_r_bar_u_bar
 
 d_b_ru = sum of d_r_bar_u_bar along axis = 0
 
 d_b_c = sum of d_c_bar along axis = 0

Métodos públicos

estático <T estende o número> GRUBlockCellGrad <T>	create ( Escopo do escopo, Operando <T> x, Operando <T> hPrev, Operando <T> wRu, Operando <T> wC, Operando <T> bRu, Operando <T> bC, Operando <T> r, Operando <T > u, Operando <T> c, Operando <T> dH) Método de fábrica para criar uma classe que envolve uma nova operação GRUBlockCellGrad.
Saída <T>	dCBar ()
Saída <T>	dHPrev ()
Saída <T>	dRBarUBar ()
Saída <T>	dX ()

Métodos Herdados

Da classe org.tensorflow.op.PrimitiveOp

booleano final	igual a (objeto obj)
final int	código de hash ()
Operação	op () Retorna a `Operation` subjacente
String final	toString ()

Da classe java.lang.Object

boleano	igual a (objeto arg0)
Aula final<?>	getClass ()
int	código de hash ()
vazio final	notifique ()
vazio final	notifiqueTodos ()
Fragmento	toString ()
vazio final	espere (long arg0, int arg1)
vazio final	espere (arg0 longo)
vazio final	espere ()

Métodos públicos

public static GRUBlockCellGrad <T> create ( Escopo do escopo, Operando <T> x, Operando <T> hPrev, Operando <T> wRu, Operando <T> wC, Operando <T> bRu, Operando <T> bC, Operando <T > r, Operando <T> u, Operando <T> c, Operando <T> dH)

Método de fábrica para criar uma classe que envolve uma nova operação GRUBlockCellGrad.

Parâmetros

alcance	escopo atual

GRUBlockCellGrad

Métodos públicos

Métodos Herdados

Métodos públicos

public static GRUBlockCellGrad <T> create ( Escopo do escopo, Operando <T> x, Operando <T> hPrev, Operando <T> wRu, Operando <T> wC, Operando <T> bRu, Operando <T> bC, Operando <T > r, Operando <T> u, Operando <T> c, Operando <T> dH)

Parâmetros

Devoluções

Saída pública <T> dCBar ()

Saída pública <T> dHPrev ()

Saída pública <T> dRBarUBar ()

Saída pública <T> dX ()

GRUBlockCellGrad Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Métodos públicos

Métodos Herdados

Métodos públicos

public static GRUBlockCellGrad <T> create ( Escopo do escopo, Operando <T> x, Operando <T> hPrev, Operando <T> wRu, Operando <T> wC, Operando <T> bRu, Operando <T> bC, Operando <T > r, Operando <T> u, Operando <T> c, Operando <T> dH)

Parâmetros

Devoluções

Saída pública <T> dCBar ()

Saída pública <T> dHPrev ()

Saída pública <T> dRBarUBar ()

Saída pública <T> dX ()

GRUBlockCellGrad