บันทึกวันที่! Google I / O ส่งคืนวันที่ 18-20 พฤษภาคม ลงทะเบียนตอนนี้

tf_agents.bandits.policies.policy_utilities.PerArmPolicyInfo

PerArmPolicyInfo(log_probability, predicted_rewards_mean, predicted_rewards_optimistic, predicted_rewards_sampled, bandit_policy_type, chosen_arm_features)

log_probability

predicted_rewards_mean

predicted_rewards_optimistic

predicted_rewards_sampled

bandit_policy_type

chosen_arm_features