Esta página foi traduzida pela API Cloud Translation.
Switch to English

tf.estimator.RunConfig

TensorFlow 1 versão Ver fonte no GitHub

Essa classe especifica as configurações para um Estimator prazo.

Usado nos cadernos

Usado na guia Usado nos tutoriais

model_dir directório onde os parâmetros do modelo, gráfico, etc são salvos. Se PathLike objeto, o caminho será resolvido. Se None , usará um valor padrão definido pelo Estimador.
tf_random_seed semente aleatória para initializers TensorFlow. Definir este valor permite coerência entre reprises.
save_summary_steps Salvar resumos a cada isso muitas etapas.
save_checkpoints_steps Salvar pontos de verificação a cada isso muitas etapas. Não pode ser especificado com save_checkpoints_secs .
save_checkpoints_secs Salvar pontos de verificação a cada isso muitos segundos. Não pode ser especificado com save_checkpoints_steps . O padrão é 600 segundos, se ambos os save_checkpoints_steps e save_checkpoints_secs não estão definidas no construtor. Se ambos os save_checkpoints_steps e save_checkpoints_secs são None , postos de controle, em seguida, são desativados.
session_config um ConfigProto usado para parâmetros de sessão definido ou None .
keep_checkpoint_max O número máximo de arquivos de ponto de verificação recentes para manter. À medida que novos arquivos são criados, os arquivos mais antigos são eliminados. Se None ou 0, todos os arquivos de ponto de verificação são mantidos. O padrão é 5 (ou seja, os 5 arquivos ponto de verificação mais recentes são mantidos). Se um protetor é passado para o estimador, este argumento será ignorado.
keep_checkpoint_every_n_hours Número de horas entre cada ponto de verificação para ser salvo. O valor padrão de 10.000 horas efetivamente desativa o recurso.
log_step_count_steps A frequência, em número de etapas globais, que o passo global e a perda será registrado durante o treinamento. Também controla a freqüência com que os passos globais / s será registrado (e gravados resumo) durante o treinamento.
train_distribute Uma instância opcional do tf.distribute.Strategy . Se especificado, então Estimador vai distribuir modelo do usuário durante o treinamento, de acordo com a política especificada por essa estratégia. Definir experimental_distribute.train_distribute é o preferido.
device_fn A exigível invocado para cada Operation que leva a Operation e retorna a string dispositivo. Se None , o padrão é a função de dispositivo retornado por tf.train.replica_device_setter com a estratégia de round-robin.
protocol Um argumento opcional que especifica o protocolo usado ao iniciar servidor. None meio padrão para grpc.
eval_distribute Uma instância opcional do tf.distribute.Strategy . Se especificado, então Estimador vai distribuir modelo do usuário durante a avaliação, de acordo com a política especificada por essa estratégia. Definir experimental_distribute.eval_distribute é o preferido.
experimental_distribute Um opcional tf.contrib.distribute.DistributeConfig objeto especificando configuração relacionada ao DistributionStrategy. O train_distribute e eval_distribute podem ser passados como parâmetros para RunConfig ou nos experimental_distribute mas não ambos.
experimental_max_worker_delay_secs Um inteiro opcional que especifica o tempo máximo que um trabalhador deve esperar antes de começar. Por padrão, os trabalhadores são iniciados em tempos escalonados, com cada trabalhador a ser adiada por até 60 segundos. Este destina-se a reduzir o risco de divergência, o que pode ocorrer quando muitos trabalhadores atualizar simultaneamente os pesos de um modelo inicializados aleatoriamente. Os usuários que warm-começam seus modelos e treiná-los para curtos períodos de tempo (alguns minutos ou menos) deve considerar reduzir este padrão para melhorar os tempos de treinamento.
session_creation_timeout_secs trabalhadores a tempo Max deve esperar por uma sessão para se tornar disponível (na inicialização ou quando se recuperando de uma sessão) com MonitoredTrainingSession. O padrão é 7200 segundos, mas os usuários podem querer definir um valor mais baixo para detectar problemas com a variável / sessão (re) -initialization mais rapidamente.

ValueError Se ambos os save_checkpoints_steps e save_checkpoints_secs estão definidos.

cluster_spec

device_fn Retorna o device_fn.

Se device_fn não é None , que substitui a função do dispositivo padrão usado em Estimator . Caso contrário, o padrão é usado.

eval_distribute Opcional tf.distribute.Strategy para avaliação.
evaluation_master

experimental_max_worker_delay_secs

global_id_in_cluster A ID global no conjunto de treinamento.

Todos os ids globais no cluster formação são atribuídos a partir de uma seqüência crescente de números inteiros consecutivos. O primeiro id é 0.

 cluster = {'chief': ['host0:2222'],
'ps': ['host1:2222', 'host2:2222'],
'worker': ['host3:2222', 'host4:2222', 'host5:2222']}
 

Nós com o tipo de tarefa worker pode ter ID de 0, 1, 2. nós com o tipo de tarefa ps pode ter id, 0, 1. Então, task_id não é única, mas o par ( task_type , task_id ) pode determinar exclusivamente um nó no cluster .

id global, ou seja, neste campo, está rastreando o índice do nó entre nós todos no cluster. Ele é atribuído exclusivamente. Por exemplo, para a especificação de cluster dada acima, os ids globais são designados como:

 task_type  | task_id  |  global_id
--------------------------------
chief      | 0        |  0
worker     | 0        |  1
worker     | 1        |  2
worker     | 2        |  3
ps         | 0        |  4
ps         | 1        |  5
 

is_chief

keep_checkpoint_every_n_hours

keep_checkpoint_max

log_step_count_steps

master

model_dir

num_ps_replicas

num_worker_replicas

protocol Retorna o valor de protocolo opcional.
save_checkpoints_secs

save_checkpoints_steps

save_summary_steps

service Retorna a plataforma definida (em TF_CONFIG) dict serviço.
session_config

session_creation_timeout_secs

task_id

task_type

tf_random_seed

train_distribute Opcional tf.distribute.Strategy para o treinamento.

Métodos

replace

Ver fonte

Retorna uma nova instância de RunConfig substituindo propriedades especificadas.

Somente as propriedades na lista a seguir são permitidos para ser substituído:

  • model_dir ,
  • tf_random_seed ,
  • save_summary_steps ,
  • save_checkpoints_steps ,
  • save_checkpoints_secs ,
  • session_config ,
  • keep_checkpoint_max ,
  • keep_checkpoint_every_n_hours ,
  • log_step_count_steps ,
  • train_distribute ,
  • device_fn ,
  • protocol .
  • eval_distribute ,
  • experimental_distribute ,
  • experimental_max_worker_delay_secs ,

Além disso, tanto save_checkpoints_steps ou save_checkpoints_secs podem ser ajustados (não devem ser ambos).

args
**kwargs palavra-chave propriedades nomeadas com novos valores.

Levanta
ValueError Se qualquer nome de propriedade em kwargs não existe ou não tem permissão para ser substituído, ou ambos save_checkpoints_steps e save_checkpoints_secs são set.

Devoluções
uma nova instância do RunConfig .