Ta strona została przetłumaczona przez Cloud Translation API.
Switch to English

tf.estimator.RunConfig

TensorFlow 1 wersja Zobacz źródło na GitHub

Klasa ta określa konfiguracje dla Estimator metę.

Stosowany w notebookach

Używany w przewodniku Używany w samouczków

model_dir Katalog, w którym zapisywane są parametry modelu, wykres, itp. Jeśli PathLike obiektu, ścieżka zostanie rozwiązany. Jeśli None , użyje domyślną wartość ustawioną przez prognozy.
tf_random_seed Random seed dla inicjalizatorów TensorFlow. Ustawienie tej wartości pozwala spójność powtórkach.
save_summary_steps Zapisz streszczenia co to wiele etapów.
save_checkpoints_steps Zapisz punkty kontrolne każdy to wiele etapów. Nie można określić z save_checkpoints_secs .
save_checkpoints_secs Zapisz punkty kontrolne każdy to wiele sekund. Nie można określić z save_checkpoints_steps . Domyślnie 600 sekund, jeżeli obie save_checkpoints_steps i save_checkpoints_secs nie są ustawione w konstruktora. Jeżeli obie save_checkpoints_steps i save_checkpoints_secsNone , wówczas punkty kontrolne są wyłączone.
session_config ConfigProto używany do ustawiania parametrów sesji lub None .
keep_checkpoint_max Maksymalna liczba plików ostatnich punktów kontrolnych zachować. Jak tworzone są nowe pliki, starsze pliki są usuwane. Jeśli None lub 0, wszystkie pliki są przechowywane punktów kontrolnych. Domyślne do 5 (to znaczy 5 ostatnich punktów kontrolnych są przechowywane pliki). Jeśli wygaszacz jest przekazywana do estymatora, argument ten zostanie zignorowany.
keep_checkpoint_every_n_hours Liczba godzin między każdym punkcie kontrolnym być zapisane. Domyślna wartość 10000 godzin skutecznie dezaktywuje funkcję.
log_step_count_steps Częstotliwość, w liczbie globalnych krokach, że globalny krok i straty będą rejestrowane w czasie treningu. kontroluje również częstotliwość, że globalne stopnie / s będzie być zalogowany (a) pisemne do podsumowania podczas treningu.
train_distribute Opcjonalna instancja tf.distribute.Strategy . Jeśli określony, następnie Estymator będzie dystrybuować modelu użytkownika w trakcie szkolenia, zgodnie z polityką określoną przez tę strategię. Ustawianie experimental_distribute.train_distribute jest korzystne.
device_fn Wywoływalnym wywoływana dla każdej Operation , która przybiera Operation i zwraca łańcuch urządzenia. Jeśli None , domyślnie do funkcji urządzenia zwracany przez tf.train.replica_device_setter ze strategią round-robin.
protocol Argument opcjonalny, który określa protokół używany podczas uruchamiania serwera. None środki domyślnie grpc.
eval_distribute Opcjonalna instancja tf.distribute.Strategy . Jeśli określony, następnie Estymator będzie dystrybuować modelu użytkownika w trakcie oceny, zgodnie z polityką określoną przez tę strategię. Ustawianie experimental_distribute.eval_distribute jest korzystne.
experimental_distribute Opcjonalny tf.contrib.distribute.DistributeConfig obiekt określający DistributionStrategy związanego konfigurację. train_distribute i eval_distribute mogą być przekazywane jako parametry do RunConfig lub ustawić w experimental_distribute ale nie oba.
experimental_max_worker_delay_secs Opcjonalna liczba całkowita określająca maksymalny czas pracownik powinien czekać przed uruchomieniem. Domyślnie pracownicy są uruchamiane z przesunięciem czasu, a każdy pracownik jest opóźniona o 60 sekund. Ma to na celu zmniejszenie ryzyka rozbieżności, które mogą wystąpić, gdy wielu pracowników jednocześnie zaktualizować wagi losowo zainicjowany modelu. Użytkownicy, którzy ciepły start swoje modele i szkolić je przez krótki czas (kilka minut lub mniej) należy rozważyć zmniejszenie to ustawienie domyślne, aby skrócić czas szkolenia.
session_creation_timeout_secs Maksymalna liczba pracowników czasowych powinny czekać na sesję, by stać się dostępny (na inicjalizacji lub podczas odzyskiwania sesji) z MonitoredTrainingSession. Domyślnie 7200 sekund, ale użytkownicy mogą chcieć ustawić niższą wartość (re) -initialization szybciej wykryć problemy ze zmiennym / sesji.

ValueError Jeżeli obie save_checkpoints_steps i save_checkpoints_secs są ustawione.

cluster_spec

device_fn Zwraca device_fn.

Jeśli device_fn nie jest None , zastępuje funkcję domyślne urządzenie używane w Estimator . W przeciwnym razie jeden domyślnym.

eval_distribute Opcjonalnie tf.distribute.Strategy do oceny.
evaluation_master

experimental_max_worker_delay_secs

global_id_in_cluster Globalny identyfikator w zestawie szkoleniowym.

Wszystkie globalne identyfikatory w klastrze szkolenia są przypisane z rosnącym ciągiem kolejnych liczb całkowitych. Pierwszy identyfikator 0.

 cluster = {'chief': ['host0:2222'],
'ps': ['host1:2222', 'host2:2222'],
'worker': ['host3:2222', 'host4:2222', 'host5:2222']}
 

Węzły typu zadania worker może mieć id 0, 1, 2. węzły typu zadania ps może mieć identyfikator, 0, 1. Tak więc, task_id nie jest przypisany, a para ( task_type , task_id ) można jednoznacznie określić węzłów w klastrze ,

Globalny id, czyli w tym polu, jest śledzenie indeksu węzła spośród wszystkich węzłów w klastrze. To jest jednoznacznie przypisany. Na przykład, w specyfikacji klastra podanych powyżej globalne identyfikatory przypisane są:

 task_type  | task_id  |  global_id
--------------------------------
chief      | 0        |  0
worker     | 0        |  1
worker     | 1        |  2
worker     | 2        |  3
ps         | 0        |  4
ps         | 1        |  5
 

is_chief

keep_checkpoint_every_n_hours

keep_checkpoint_max

log_step_count_steps

master

model_dir

num_ps_replicas

num_worker_replicas

protocol Zwraca wartość opcjonalnego protokołu.
save_checkpoints_secs

save_checkpoints_steps

save_summary_steps

service Zwraca określoną platformę (w TF_CONFIG) dict usług.
session_config

session_creation_timeout_secs

task_id

task_type

tf_random_seed

train_distribute Opcjonalnie tf.distribute.Strategy do szkolenia.

metody

replace

Pokaż źródło

Zwraca nową instancję RunConfig zastępując określone właściwości.

Tylko właściwości w poniższym wykazie mogą być zastąpione:

  • model_dir ,
  • tf_random_seed ,
  • save_summary_steps ,
  • save_checkpoints_steps ,
  • save_checkpoints_secs ,
  • session_config ,
  • keep_checkpoint_max ,
  • keep_checkpoint_every_n_hours ,
  • log_step_count_steps ,
  • train_distribute ,
  • device_fn ,
  • protocol .
  • eval_distribute ,
  • experimental_distribute ,
  • experimental_max_worker_delay_secs ,

Ponadto każda save_checkpoints_steps lub save_checkpoints_secs mogą być ustawione (nie powinny być jednocześnie).

args
**kwargs keyword właściwości nazwanych z nowymi wartościami.

podbicia
ValueError Jeśli jakakolwiek nazwa właściwości w kwargs nie istnieje lub nie może być zastąpione, lub oba save_checkpoints_steps i save_checkpoints_secs są ustawione.

Zwroty
nowa instancja RunConfig .