Operacja, która wykonuje aktualizacje gradientowe osadzanych tabel.
Argument gradientów to TensorList mający tę samą długość i kształt, co wartość zwracana przez XlaRecvTPUEmbeddingActivations, ale zawiera gradienty straty modelu w odniesieniu do aktywacji osadzania. Tabele osadzania są aktualizowane na podstawie tych gradientów za pośrednictwem optymalizatora określonego w protocie TPUEmbeddingConfiguration przekazanym do tpu.initialize_system.
Metody publiczne
statyczne gradienty XlaSendTPUEembedding |
Metody dziedziczone
Metody publiczne
public static XlaSendTPUEmbeddingGradients create ( zakres zakresu , Iterable< Operand <Float>> gradienty, Iterable< Operand <Float>> learningRates, Operand <?> deduplicationData, String config)
Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację XlaSendTPUEmbeddingGradients.
Parametry
zakres | aktualny zakres |
---|---|
gradienty | TensorList gradientów, za pomocą których można aktualizować tabele osadzania. |
stawki za naukę | TensorList szybkości uczenia się używany do aktualizowania tabel osadzania za pomocą optymalizatora. Długość TensorList musi być równa liczbie znaczników dynamicznej szybkości uczenia się określonych w protokole TPUEmbeddingConfiguration. |
deduplikacjaDane | Tensor o typie=DT_VARIANT zawierający dane deduplikacyjne. Tensor jest zagnieżdżoną krotką XLA zawierającą N elementów (gdzie N jest stosunkiem liczby osadzonych do rdzeni tensorowych na chip TPU). Każdy element zagnieżdżonej krotki jest krotką tensorów rangi 1. Każdy tensor zawiera indeksy (DT_UINT32) do wyszukiwania osadzania w TensorCore lub wagi (DT_FLOAT) do zastosowania do danych wyjściowych operacji wyszukiwania osadzania. |
konfiguracja | Serializowany proto konfiguracji TPUEmbeddingConfiguration. |
Zwroty
- nowa instancja XlaSendTPUEmbeddingGradients