CudnnRNNBackpropV3

clase final pública CudnnRNNBackpropV3

Paso de backprop de CudnnRNNV3.

Calcule el backprop de datos y pesos en un RNN. Toma una entrada extra "sequence_lengths" que CudnnRNNBackprop.

rnn_mode: Indica el tipo de modelo RNN. input_mode: Indica si hay una proyección lineal entre la entrada y el cálculo real antes de la primera capa. 'skip_input' solo se permite cuando input_size == num_units; 'auto_select' implica 'skip_input' cuando input_size == num_units; de lo contrario, implica 'linear_input'. direction: Indica si se utilizará un modelo bidireccional. Debe ser "unidireccional" o "bidireccional". abandono: probabilidad de abandono. Cuando se establece en 0., la deserción está desactivada. semilla: La primera parte de una semilla para inicializar la deserción. seed2: la segunda parte de una semilla para inicializar la deserción. input: si time_major es verdadero, este es un tensor 3-D con la forma de [seq_length, batch_size, input_size]. Si time_major es falso, la forma es [batch_size, seq_length, input_size]. input_h: Si time_major es verdadero, este es un tensor 3-D con la forma de [num_layer * dir, batch_size, num_units]. Si time_major es falso, la forma es [batch_size, num_layer * dir, num_units]. input_c: para LSTM, un tensor 3D con la forma de [num_layer * dir, batch, num_units]. Para otros modelos, se ignora. params: un tensor 1-D que contiene los pesos y los sesgos en un diseño opaco. El tamaño debe crearse mediante CudnnRNNParamsSize e inicializarse por separado. Tenga en cuenta que es posible que no sean compatibles entre distintas generaciones. Por lo tanto, es una buena idea guardar y restaurar sequence_lengths: un vector de longitudes de cada secuencia de entrada. salida: si time_major es verdadero, este es un tensor 3-D con la forma de [seq_length, batch_size, dir * num_units]. Si time_major es falso, la forma es [batch_size, seq_length, dir * num_units]. output_h: la misma forma tiene input_h. output_c: la misma forma que input_c para LSTM. Un tensor vacío para otros modelos. output_backprop: Un tensor 3-D con la misma forma que la salida en el pase directo. output_h_backprop: Un tensor 3-D con la misma forma que output_h en el pase directo. output_c_backprop: Un tensor 3-D con la misma forma que output_c en el pase directo. time_major: indica si el formato de entrada / salida es time major o batch major. reserve_space: El mismo reserve_space producido en la operación de avance. input_backprop: El backprop para ingresar en el pase hacia adelante. Tiene la misma forma que la entrada. input_h_backprop: El backprop a input_h en la pasada hacia adelante. Tiene la misma forma que input_h. input_c_backprop: El backprop a input_c en la pasada hacia adelante. Tiene la misma forma que input_c. params_backprop: el backprop al búfer de params en el pase directo. Tiene la misma forma que params.

Clases anidadas

clase CudnnRNNBackpropV3.Options Atributos opcionales para CudnnRNNBackpropV3

Métodos públicos

estático <T extiende Número> CudnnRNNBackpropV3 <T>
create ( alcance de alcance, operando <T> entrada, operando <T> inputH, operando <T> inputC, operando <T> parámetros, operando <Integer> secuenciaLengths, operando <T> salida, operando <T> salidaH, operando <T > outputC, operando <T> outputBackprop, operando <T> outputHBackprop, operando <T> outputCBackprop, operando <T> reserveSpace, operando <?> hostReserved, opciones ... opciones)
Método de fábrica para crear una clase que envuelva una nueva operación CudnnRNNBackpropV3.
static CudnnRNNBackpropV3.Options
static CudnnRNNBackpropV3.Options
abandono ( abandono flotante)
Salida <T>
Salida <T>
Salida <T>
static CudnnRNNBackpropV3.Options
inputMode (String inputMode)
static CudnnRNNBackpropV3.Options
numProj ( numProj largo)
Salida <T>
static CudnnRNNBackpropV3.Options
rnnMode (Cadena rnnMode)
static CudnnRNNBackpropV3.Options
semilla ( semilla larga)
static CudnnRNNBackpropV3.Options
seed2 (Semilla larga2)
static CudnnRNNBackpropV3.Options
timeMajor (booleano timeMajor)

Métodos heredados

Métodos públicos

public static CudnnRNNBackpropV3 <T> create ( alcance de alcance, operando <T> entrada, operando <T> inputH, operando <T> inputC, operando <T> params, operando <Integer> sequenceLengths, operando <T> salida, operando <T > outputH, operando <T> outputC, operando <T> outputBackprop, operando <T> outputHBackprop, operando <T> outputCBackprop, operando <T> reserveSpace, operando <?> hostReserved, opciones ... opciones)

Método de fábrica para crear una clase que envuelva una nueva operación CudnnRNNBackpropV3.

Parámetros
alcance alcance actual
opciones lleva valores de atributos opcionales
Devoluciones
  • una nueva instancia de CudnnRNNBackpropV3

public static CudnnRNNBackpropV3.Options direction (String direction)

public static CudnnRNNBackpropV3.Options dropout (Float dropout)

Salida pública <T> inputBackprop ()

Salida pública <T> inputCBackprop ()

Salida pública <T> inputHBackprop ()

public static CudnnRNNBackpropV3.Options inputMode (String inputMode)

public static CudnnRNNBackpropV3.Options numProj (Long numProj)

Salida pública <T> paramsBackprop ()

public static CudnnRNNBackpropV3.Options rnnMode (String rnnMode)

public static CudnnRNNBackpropV3.Options seed (Long seed)

public static CudnnRNNBackpropV3.Options seed2 (Long seed2)

public static CudnnRNNBackpropV3.Options timeMajor (Boolean timeMajor)