"*var" را طبق الگوریتم Adam به روز کنید.
$$\text{lr}_t := \mathrm{learning_rate} * \sqrt{1 - \beta_2^t} / (1 - \beta_1^t)$$$$m_t := \beta_1 * m_{t-1} + (1 - \beta_1) * g$$$$v_t := \beta_2 * v_{t-1} + (1 - \beta_2) * g * g$$$$\hat{v}_t := max{\hat{v}_{t-1}, v_t}$$$$\text{variable} := \text{variable} - \text{lr}_t * m_t / (\sqrt{\hat{v}_t} + \epsilon)$$
کلاس های تو در تو
کلاس | ResourceApplyAdamWithAmsgrad.Options | ویژگی های اختیاری برای ResourceApplyAdamWithAmsgrad |
روش های عمومی
استاتیک <T> ResourceApplyAdamWithAmsgrad | ایجاد ( دامنه دامنه ، عملوند <?> var، عملوند <?> m، عملوند <?> v، عملوند <?> vhat، عملوند <T> beta1Power، عملوند <T> beta2Power، عملوند <T> lr، عملوند <T > beta1، Operand <T> beta2، Operand <T> epsilon، Operand <T> grad، Options... گزینهها) روش کارخانه برای ایجاد کلاسی که یک عملیات ResourceApplyAdamWithAmsgrad جدید را بسته بندی می کند. |
استاتیک ResourceApplyAdamWithAmsgrad.Options | useLocking (قفل کردن استفاده بولی) |
روش های ارثی
روش های عمومی
عمومی استاتیک ResourceApplyAdamWithAmsgrad ایجاد ( محدوده دامنه ، عملوند <?> var، عملوند <?> m، عملوند <?> v، عملوند <?> vhat، عملوند <T> beta1Power، عملوند <T> beta2Power، عملوند <T> lr، Operand <T> beta1، Operand <T> beta2، Operand <T> epsilon، Operand <T> grad، Options... گزینهها)
روش کارخانه برای ایجاد کلاسی که یک عملیات ResourceApplyAdamWithAmsgrad جدید را بسته بندی می کند.
پارامترها
دامنه | محدوده فعلی |
---|---|
var | باید از یک متغیر () باشد. |
متر | باید از یک متغیر () باشد. |
v | باید از یک متغیر () باشد. |
vhat | باید از یک متغیر () باشد. |
beta1Power | باید اسکالر باشد. |
beta2Power | باید اسکالر باشد. |
lr | ضریب پوسته پوسته شدن باید اسکالر باشد. |
بتا 1 | عامل حرکت. باید اسکالر باشد. |
بتا2 | عامل حرکت. باید اسکالر باشد. |
اپسیلون | ترم ریج. باید اسکالر باشد. |
درجه | گرادیان. |
گزینه ها | مقادیر ویژگی های اختیاری را حمل می کند |
برمی گرداند
- یک نمونه جدید از ResourceApplyAdamWithAmsgrad
Public Static ResourceApplyAdamWithAmsgrad.Options useLocking (useLocking بولی)
پارامترها
استفاده از قفل کردن | اگر «درست» باشد، بهروزرسانی تانسورهای var، m و v توسط یک قفل محافظت میشود. در غیر این صورت رفتار تعریف نشده است، اما ممکن است اختلاف کمتری از خود نشان دهد. |
---|