此页面由 Cloud Translation API 翻译。
Switch to English

tf.estimator.RunConfig

TensorFlow 1版 GitHub上查看源代码

此类指定的配置Estimator运行。

用在笔记本电脑

使用的指南使用教程

model_dir 目录中的模型参数,图表等被保存。如果PathLike对象,路径将得到解决。如果None ,将使用的估算设置的默认值。
tf_random_seed 随机种子TensorFlow初始化。设置此值允许重播之间的一致性。
save_summary_steps 保存每一个总结这许多步骤。
save_checkpoints_steps 保存每个检查点这许多步骤。不能与指定save_checkpoints_secs
save_checkpoints_secs 保存每个检查点这么多秒。不能与指定save_checkpoints_steps 。默认设置为600秒,如果都save_checkpoints_stepssave_checkpoints_secs在构造函数中未设置。如果两个save_checkpoints_stepssave_checkpoints_secsNone ,然后检查站被禁用。
session_config 一个ConfigProto用于设置会话参数,或None
keep_checkpoint_max 最近的检查点文件的最大数量,以保持。作为新的文件被创建,旧的文件被删除。如果None或0,所有检查点文件将被保留。默认为5(即5个最近的检查点文件保存)。如果保护被传递到估计,这种说法将被忽略。
keep_checkpoint_every_n_hours 要保存的每个关卡之间的小时数。 10000小时的预设值有效地禁用该功能。
log_step_count_steps 该频率在全球步数,全球步骤和损失将在培训期间被记录。也控制在训练期间,全球步骤/ s的将被记录(并写入摘要)的频率。
train_distribute 一个可选的实例tf.distribute.Strategy 。如果指定,则估计会在训练中分发用户的模型,根据该战略规定的政策。设置experimental_distribute.train_distribute是优选的。
device_fn 可调用调用每一个Operation ,是以Operation ,并返回设备的字符串。如果None ,则默认为设备函数返回由tf.train.replica_device_setter与循环赛战略。
protocol 一个可选参数,指定开始服务器时使用的协议。 None手段默认GRPC。
eval_distribute 一个可选的实例tf.distribute.Strategy 。如果指定,则估计会在评估期间分发用户的模型,根据该战略规定的政策。设置experimental_distribute.eval_distribute是优选的。
experimental_distribute 可选tf.contrib.distribute.DistributeConfig对象指定DistributionStrategy相关的配置。该train_distributeeval_distribute可以作为参数传递RunConfig或设置experimental_distribute ,但不能同时使用。
experimental_max_worker_delay_secs 一个可选整数,指定最大时间工人在开始之前应该等待。默认情况下,工人在交错的时间开始,每个工人由60秒被推迟。这是为了减少分歧的风险,当许多工人同时更新随机初始化模型的权重可能发生。用户谁预热开始他们的模型,并训练他们在短时间内(几分钟或更少)应考虑减少这个缺省提高训练时间。
session_creation_timeout_secs 最多时工人应等待(恢复会话时在初始化或)会话成为可用MonitoredTrainingSession。默认值7200秒,但用户可能要设置一个较低的值(重新)更迅速地-initialization检测与可变/会话的问题。

ValueError 如果两个save_checkpoints_stepssave_checkpoints_secs设置。

cluster_spec

device_fn 返回device_fn。

如果device_fn不是None ,它覆盖在使用默认设备功能Estimator 。否则,使用默认的一个。

eval_distribute 可选tf.distribute.Strategy进行评估。
evaluation_master

experimental_max_worker_delay_secs

global_id_in_cluster 培训集群中的全局ID。

培训集群中的所有全局ID是从连续整数的递增顺序分配。第一个ID为0。

 cluster = {'chief': ['host0:2222'],
'ps': ['host1:2222', 'host2:2222'],
'worker': ['host3:2222', 'host4:2222', 'host5:2222']}
 

与任务类型的节点worker可以具有ID为0,1,2与任务类型的节点ps可以具有ID,0,1。因此, task_id不是唯一的,但该对( task_typetask_id )可以唯一地确定集群中的节点。

全局ID,即这一领域,在跟踪集群中的所有节点之间的节点的索引。它是唯一分配。例如,对于上面给定的簇属,该全局ID被分配为:

 task_type  | task_id  |  global_id
--------------------------------
chief      | 0        |  0
worker     | 0        |  1
worker     | 1        |  2
worker     | 2        |  3
ps         | 0        |  4
ps         | 1        |  5
 

is_chief

keep_checkpoint_every_n_hours

keep_checkpoint_max

log_step_count_steps

master

model_dir

num_ps_replicas

num_worker_replicas

protocol 返回可选协议值。
save_checkpoints_secs

save_checkpoints_steps

save_summary_steps

service 返回定义的平台(在TF_CONFIG)服务字典。
session_config

session_creation_timeout_secs

task_id

task_type

tf_random_seed

train_distribute 可选tf.distribute.Strategy培训。

方法

replace

查看源代码

返回的新实例RunConfig更换指定的属性。

只有在以下列表中的性能被允许进行更换:

  • model_dir
  • tf_random_seed
  • save_summary_steps
  • save_checkpoints_steps
  • save_checkpoints_secs
  • session_config
  • keep_checkpoint_max
  • keep_checkpoint_every_n_hours
  • log_step_count_steps
  • train_distribute
  • device_fn
  • protocol
  • eval_distribute
  • experimental_distribute
  • experimental_max_worker_delay_secs

此外,无论是save_checkpoints_stepssave_checkpoints_secs可设置(不应该两者)。

ARGS
**kwargs 关键字用新值命名属性。

加薪
ValueError 如果任何属性名kwargs不存在或不允许被替换,或两者save_checkpoints_stepssave_checkpoints_secs设置。

返回
的新实例RunConfig