ResourceSparseApplyKerasMomentum

ResourceSparseApplyKerasMomentum คลาสสุดท้ายสาธารณะ

อัปเดตรายการที่เกี่ยวข้องใน '*var' และ '*accum' ตามรูปแบบโมเมนตัม

ตั้งค่า use_nesterov = True หากคุณต้องการใช้โมเมนตัม Nesterov

นั่นคือสำหรับแถวที่เราได้ grad เราอัพเดต var และ accum ดังนี้:

สะสม = สะสม * โมเมนตัม - lr * grad var += สะสม

คลาสที่ซ้อนกัน

ระดับ ResourceSparseApplyKerasMomentum.Options แอ็ตทริบิวต์ทางเลือกสำหรับ ResourceSparseApplyKerasMomentum

วิธีการสาธารณะ

คงที่ <T, U ขยายหมายเลข> ResourceSparseApplyKerasMomentum
สร้าง ( ขอบเขต ขอบเขต ตัวถูกดำเนินการ <?> var, ตัวถูกดำเนินการ <?> accum, ตัวถูกดำเนินการ <T> lr, ตัว ถูกดำเนินการ <T> ผู้สำเร็จการศึกษา, ตัวดำเนินการ <U> ดัชนี, ตัวถูกดำเนินการ <T> โมเมนตัม, ตัวเลือก... ตัวเลือก)
วิธีการจากโรงงานเพื่อสร้างคลาสที่รวมการดำเนินการ ResourceSparseApplyKerasMomentum ใหม่
ResourceSparseApplyKerasMomentum.Options แบบคงที่
useLocking (การใช้ล็อคแบบบูลีน)
ResourceSparseApplyKerasMomentum.Options แบบคงที่
useNesterov (การใช้บูลีน UseNesterov)

วิธีการสืบทอด

วิธีการสาธารณะ

ResourceSparseApplyKerasMomentum สาธารณะ สร้าง (ขอบเขต ขอบเขต , ตัวดำเนินการ <?> var, ตัวดำเนินการ <?> accum, ตัวดำเนินการ <T> lr, ตัว ดำเนินการ <T> ผู้สำเร็จการศึกษา, ตัวดำเนินการ <U> ดัชนี, ตัวดำเนินการ <T> โมเมนตัม, ตัวเลือก... ตัวเลือก)

วิธีการจากโรงงานเพื่อสร้างคลาสที่รวมการดำเนินการ ResourceSparseApplyKerasMomentum ใหม่

พารามิเตอร์
ขอบเขต ขอบเขตปัจจุบัน
var ควรมาจากตัวแปร ()
สะสม ควรมาจากตัวแปร ()
อัตราการเรียนรู้ ต้องเป็นสเกลาร์
ผู้สำเร็จการศึกษา การไล่ระดับสี
ดัชนี เวกเตอร์ของดัชนีในมิติแรกของ var และ accum
โมเมนตัม โมเมนตัม. ต้องเป็นสเกลาร์
ตัวเลือก มีค่าแอตทริบิวต์ทางเลือก
การส่งคืน
  • อินสแตนซ์ใหม่ของ ResourceSparseApplyKerasMomentum

สาธารณะ ResourceSparseApplyKerasMomentum.Options useLocking (useLocking แบบบูลีน)

พารามิเตอร์
ใช้ล็อค หากเป็น "จริง" การอัปเดต var และ accum tensor จะได้รับการปกป้องด้วยการล็อค มิฉะนั้นพฤติกรรมจะไม่ได้กำหนดไว้ แต่อาจแสดงความขัดแย้งน้อยลง

สาธารณะ ResourceSparseApplyKerasMomentum.Options useNesterov (บูลีน useNesterov)

พารามิเตอร์
ใช้ Nesterov หากเป็น "จริง" เมตริกซ์ที่ส่งผ่านไปยังการคำนวณ Grad จะเป็น var + โมเมนตัม * สะสม ดังนั้นท้ายที่สุดแล้ว var ที่คุณได้รับก็คือ var + โมเมนตัม * สะสม