ResourceApplyAdaMax

מחלקה סופית ציבורית ResourceApplyAdaMax

עדכן את '*var' לפי אלגוריתם AdaMax.

m_t <- beta1 * m_{t-1} + (1 - beta1) * g v_t <- max(beta2 * v_{t-1}, abs(g)) משתנה <- variable - learning_rate / (1 - beta1^ t) * m_t / (v_t + epsilon)

כיתות מקוננות

מעמד ResourceApplyAdaMax.Options תכונות אופציונליות עבור ResourceApplyAdaMax

קבועים

חוּט OP_NAME השם של המבצע הזה, כפי שידוע על ידי מנוע הליבה של TensorFlow

שיטות ציבוריות

static <T מרחיב את TType > ResourceApplyAdaMax
create ( Scope scope, Operand <?> var, Operand <?> m, Operand <?> v, Operand <T> beta1Power, Operand <T> lr, Operand <T> beta1, Operand <T> beta2, Operand <T > epsilon, Operand <T> grad, Options... options)
שיטת מפעל ליצירת מחלקה העוטפת פעולת ResourceApplyAdaMax חדשה.
static ResourceApplyAdaMax.Options
useLocking (useLocking בוליאני)

שיטות בירושה

קבועים

מחרוזת סופית סטטית ציבורית OP_NAME

השם של המבצע הזה, כפי שידוע על ידי מנוע הליבה של TensorFlow

ערך קבוע: "ResourceApplyAdaMax"

שיטות ציבוריות

public static ResourceApplyAdaMax create ( Scope scope, Operand <?> var, Operand <?> m, Operand <?> v, Operand <T> beta1Power, Operand <T> lr, Operand <T> beta1, Operand <T> beta2, Operand <T> epsilon, Operand <T> grad, Options... options)

שיטת מפעל ליצירת מחלקה העוטפת פעולת ResourceApplyAdaMax חדשה.

פרמטרים
תְחוּם ההיקף הנוכחי
var צריך להיות ממשתנה().
M צריך להיות ממשתנה().
v צריך להיות ממשתנה().
beta1Power חייב להיות סקלר.
lr גורם קנה מידה. חייב להיות סקלר.
בטא1 גורם מומנטום. חייב להיות סקלר.
בטא2 גורם מומנטום. חייב להיות סקלר.
אפסילון מונח רכס. חייב להיות סקלר.
גראד השיפוע.
אפשרויות נושא ערכי תכונות אופציונליות
החזרות
  • מופע חדש של ResourceApplyAdaMax

public static ResourceApplyAdaMax.Options useLocking (שימוש בוליאני)

פרמטרים
השתמש בנעילה אם 'נכון', עדכון הטנזורים var, m ו-v יהיה מוגן על ידי מנעול; אחרת ההתנהגות אינה מוגדרת, אך עלולה להפגין פחות מחלוקת.