Ta strona została przetłumaczona przez Cloud Translation API.
Switch to English

tf.nn.nce_loss

TensorFlow 1 wersja Zobacz źródło na GitHub

Oblicza i zwraca utraty szkoleniowy oszacowanie szumu kontrastowe.

Zobacz hałas przeciwstawiona oszacowanie: nowe zasady szacowania dla nieznormalizowanych modeli statystycznych . Zobacz także naszą Candidate Algorytmy próbkowania Reference

Typowym przykładem zastosowania jest użycie tej metody do treningu, i obliczyć pełną esicy stratę do oceny lub wnioskowania, jak w poniższym przykładzie:

 if mode == "train":
  loss = tf.nn.nce_loss(
      weights=weights,
      biases=biases,
      labels=labels,
      inputs=inputs,
      ...)
elif mode == "eval":
  logits = tf.matmul(inputs, tf.transpose(weights))
  logits = tf.nn.bias_add(logits, biases)
  labels_one_hot = tf.one_hot(labels, n_classes)
  loss = tf.nn.sigmoid_cross_entropy_with_logits(
      labels=labels_one_hot,
      logits=logits)
  loss = tf.reduce_sum(loss, axis=1)
 

weights Tensor kształtu [num_classes, dim] , lub listę Tensor przedmioty, których wymiar wzdłuż konkatenacji 0 ma kształt [num_classes DIM]. (Możliwie partycjami) zanurzeń klasy.
biases Tensor kształtu [num_classes] . Uprzedzeń klasy.
labels Tensor typu int64 i kształt [batch_size, num_true] . Klasy docelowe.
inputs Tensor kształtu [batch_size, dim] . Forward aktywacje sieci wejściowego.
num_sampled int . Liczba negatywnych klas losowo próbki na partię. Ta pojedyncza próbka negatywnych zajęciach oceniana jest dla każdego elementu w partii.
num_classes int . Liczba możliwych klas.
num_true int . Liczba klas docelowych na przykład szkolenia.
sampled_values krotką ( sampled_candidates , true_expected_count , sampled_expected_count ) zwróconych przez *_candidate_sampler funkcji. (jeśli brak, to domyślnie log_uniform_candidate_sampler )
remove_accidental_hits bool . Czy usunąć „przypadkowe trafienia”, w którym pobrano próbki klasa równa jednej z klas docelowych. Jeśli ustawione na True , że jest to „pobrana próbka Logistic” strata zamiast NCE i uczymy się wygenerować log-odds zamiast prawdopodobieństw dziennika. Zobacz naszą Candidate Algorytmy próbkowania Reference . Domyślną jest false.
name Nazwę operacji (opcjonalnie).

batch_size 1-D tensor-strat na przykład NCE.