SparseSoftmaxCrossEntropyWithLogits

публичный класс SparseSoftmaxCrossEntropyWithLogits

Публичные конструкторы

Публичные методы

static <T расширяет TNumber , U расширяет TNumber > Операнд
sparseSoftmaxCrossEntropyWithLogits (область действия , метки операндов <T>, логиты операндов <U>)
Вычисляет разреженную перекрестную энтропию softmax между logits и labels .

Унаследованные методы

Публичные конструкторы

общественный SparseSoftmaxCrossEntropyWithLogits ()

Публичные методы

public static Operand sparseSoftmaxCrossEntropyWithLogits (область области действия , метки операндов <T>, логиты операндов <U>)

Вычисляет разреженную перекрестную энтропию softmax между logits и labels .

Измеряет вероятностную ошибку в задачах дискретной классификации, в которых классы являются взаимоисключающими (каждая запись относится ровно к одному классу). Например, каждое изображение CIFAR-10 помечено одной и только одной меткой: на изображении может быть собака или грузовик, но не то и другое.

ПРИМЕЧАНИЕ:

Для этой операции вероятность данной метки считается исключительной. То есть мягкие классы не допускаются, и вектор labels должен предоставлять один конкретный индекс для истинного класса для каждой строки logits (каждой записи мини-пакета). Для мягкой классификации softmax с распределением вероятностей для каждой записи ERROR(/org.tensorflow.op.NnOps#softmaxCrossEntropyWithLogits) .

ПРЕДУПРЕЖДЕНИЕ:

Эта операция предполагает немасштабированные логиты, поскольку для повышения эффективности внутри нее выполняется softmax для logits . Не вызывайте эту операцию с выходными данными softmax , так как это приведет к неверным результатам.

Распространенным вариантом использования является наличие логитов формы [batchSize, numClasses] и меток формы [batchSize] , но поддерживаются более высокие измерения, и в этом случае предполагается, что размер dim -th имеет размер numClasses . logits должны иметь тип данных из TFloat16 , TFloat32 или TFloat64 , а labels должны иметь тип dtype TInt32 или TInt64 .

Параметры
объем текущий объем
этикетки Tensor формы [d_0, d_1, ..., d_{r-1}] (где r — ранг labels и результат), а dataType — TInt32 или TInt64 . Каждая запись в labels должна быть индексом в [0, numClasses) . Другие значения вызовут исключение, когда эта операция выполняется на ЦП, и вернут NaN для соответствующих строк потерь и градиента на графическом процессоре.
логиты Активации для каждой метки (обычно линейный вывод) формы [d_0, d_1, ..., d_{r-1}, numClasses] и dataType TFloat16 , TFloat32 или TFloat64 . Эти энергии активации интерпретируются как ненормированные логарифмические вероятности.
Возврат
  • Tensor той же формы, что и labels , и того же типа, что и logits , с кросс-энтропийной потерей softmax.
Броски
IllegalArgumentException Если логиты являются скалярами (должны иметь ранг >= 1) или если ранг меток не равен рангу логитов минус один.