CudnnRNNV3

clase final pública CudnnRNNV3

Un RNN respaldado por cuDNN.

Calcula el RNN a partir de los estados inicial y de entrada, con respecto al búfer de parámetros. Acepta una entrada adicional "sequence_lengths" que CudnnRNN.

rnn_mode: Indica el tipo de modelo RNN. input_mode: indica si hay una proyección lineal entre la entrada y el cálculo real antes de la primera capa. 'skip_input' solo se permite cuando input_size == num_units; 'auto_select' implica 'skip_input' cuando input_size == num_units; de lo contrario, implica 'entrada_lineal'. dirección: Indica si se utilizará un modelo bidireccional. Debe ser "unidireccional" o "bidireccional". abandono: Probabilidad de abandono. Cuando se establece en 0, el abandono está deshabilitado. semilla: la primera parte de una semilla para inicializar el abandono. semilla2: La segunda parte de una semilla para inicializar el abandono. entrada: si time_major es verdadero, este es un tensor 3-D con la forma de [seq_length, lote_size, input_size]. Si time_major es falso, la forma es [batch_size, seq_length, input_size]. input_h: si time_major es verdadero, este es un tensor tridimensional con la forma de [num_layer * dir, lote_size, num_units]. Si time_major es falso, la forma es [batch_size, num_layer * dir, num_units]. input_c: para LSTM, un tensor 3-D con la forma de [num_layer * dir, lote, num_units]. Para otros modelos, se ignora. params: un tensor 1-D que contiene los pesos y sesgos en un diseño opaco. El tamaño debe crearse mediante CudnnRNNParamsSize e inicializarse por separado. Tenga en cuenta que es posible que no sean compatibles entre diferentes generaciones. Por lo tanto, es una buena idea guardar y restaurar secuencia_longitudes: un vector de longitudes de cada secuencia de entrada. salida: si time_major es verdadero, este es un tensor tridimensional con la forma de [seq_length, lote_size, dir * num_units]. Si time_major es falso, la forma es [batch_size, seq_length, dir * num_units]. salida_h: La misma forma tiene entrada_h. output_c: la misma forma que input_c para LSTM. Un tensor vacío para otros modelos. is_training: indica si esta operación se utiliza para inferencia o entrenamiento. time_major: indica si el formato de entrada/salida es mayor por tiempo o por lotes. reserve_space: un tensor opaco que se puede utilizar en el cálculo de backprop. Sólo se produce si is_training es verdadero.

Clases anidadas

clase CudnnRNNV3.Opciones Atributos opcionales para CudnnRNNV3

Métodos públicos

estático <T extiende Número> CudnnRNNV3 <T>
crear (alcance alcance , entrada del operando <T>, entrada del operando <T>H, entrada del operando <T>C, parámetros del operando <T>, longitudes de secuencia del operando <Integer>, opciones... opciones)
Método de fábrica para crear una clase que envuelve una nueva operación CudnnRNNV3.
CudnnRNNV3.Options estático
dirección (dirección de la cuerda)
CudnnRNNV3.Options estático
abandono (abandono flotante)
Salida <?>
CudnnRNNV3.Options estático
modo de entrada (modo de entrada de cadena)
CudnnRNNV3.Options estático
isTraining (booleano isTraining)
CudnnRNNV3.Options estático
numProj (NúmProj largo)
Salida <T>
Salida <T>
Salida <T>
Salida <T>
CudnnRNNV3.Options estático
rnnMode (cadena rnnMode)
CudnnRNNV3.Options estático
semilla (semilla larga)
CudnnRNNV3.Options estático
semilla2 (semilla larga2)
CudnnRNNV3.Options estático
timeMajor (tiempo booleano Major)

Métodos heredados

Métodos públicos

public static CudnnRNNV3 <T> create (alcance del alcance , entrada del operando <T>, entrada del operando <T>H, entrada del operando <T>C, parámetros del operando <T>, longitudes de secuencia del operando <Integer>, opciones... opciones)

Método de fábrica para crear una clase que envuelve una nueva operación CudnnRNNV3.

Parámetros
alcance alcance actual
opciones lleva valores de atributos opcionales
Devoluciones
  • una nueva instancia de CudnnRNNV3

dirección pública estática CudnnRNNV3.Options (dirección de cadena)

Abandono de CudnnRNNV3.Options estático público (abandono flotante)

Salida pública <?> hostReserved ()

público estático CudnnRNNV3.Options inputMode (String inputMode)

público estático CudnnRNNV3.Options isTraining (booleano isTraining)

público estático CudnnRNNV3.Options numProj (NumProj largo)

Salida pública <T> salida ()

Salida pública <T> salidaC ()

Salida pública <T> salidaH ()

Salida pública <T> reserveSpace ()

público estático CudnnRNNV3.Options rnnMode (String rnnMode)

semilla pública estática CudnnRNNV3.Options (semilla larga)

público estático CudnnRNNV3.Options semilla2 (semilla larga2)

público estático CudnnRNNV3.Options timeMajor (boolean timeMajor)