CTCLossV2

публичный финальный класс CTCLossV2

Вычисляет потерю CTC (вероятность журнала) для каждой записи пакета. Также рассчитывает

градиент. Этот класс выполняет за вас операцию softmax, поэтому входные данные должны быть, например, линейными проекциями выходных данных с помощью LSTM.

Вложенные классы

сорт CTCLossV2.Параметры Дополнительные атрибуты для CTCLossV2

Публичные методы

статический CTCLossV2
create ( Область области действия, входы операнда <Float>, метки операнда <Long>Indices, метки операнда <Integer>Значения, длина последовательности операнда <Integer>, параметры... )
Фабричный метод для создания класса, обертывающего новую операцию CTCLossV2.
статический CTCLossV2.Options
ctcMergeRepeated (логическое значение ctcMergeRepeated)
Выход <С плавающей запятой>
градиент ()
Градиент «потери».
статический CTCLossV2.Options
ignoreLongerOutputsThanInputs (логическое значение ignoreLongerOutputsThanInputs)
Выход <С плавающей запятой>
потеря ()
Вектор (пакет), содержащий логарифмические вероятности.
статический CTCLossV2.Options
preprocessCollapseRepeated (логическое значение preprocessCollapseRepeated)

Унаследованные методы

Публичные методы

public static CTCLossV2 create (область области действия , входы Operand <Float>, Operand <Long> labelsIndices, Operand <Integer> labelsValues, Operand <Integer>sequenceLength, Options... options)

Фабричный метод для создания класса, обертывающего новую операцию CTCLossV2.

Параметры
объем текущий объем
входы 3-D, форма: `(max_time x package_size x num_classes)`, logits. Пустая метка по умолчанию равна 0, а не num_classes — 1.
меткиИндексы Индексы `SparseTensor `. `labels_indices(i, :) == [b, t]` означает, что `labels_values(i)` хранит идентификатор для `(batch b, time t)`.
меткиЗначения Значения (метки), связанные с данной партией и временем.
длина последовательности Вектор, содержащий длины последовательности (пакетный).
параметры содержит значения необязательных атрибутов
Возврат
  • новый экземпляр CTCLossV2

общедоступный статический CTCLossV2.Options ctcMergeRepeated (логическое значение ctcMergeRepeated)

Параметры
ctcMergeRepeated Скаляр. Если установлено значение false, во время расчета CTC повторяющиеся непустые метки не будут объединены и интерпретируются как отдельные метки. Это упрощенная версия CTC.

публичный выходной градиент <Float> ()

Градиент «потери». 3-D, форма: `(max_time x package_size x num_classes)`.

public static CTCLossV2.Options ignoreLongerOutputsThanInputs (логическое значение ignoreLongerOutputsThanInputs)

Параметры
игнорироватьLongerOutputsThanInputs Скаляр. Если установлено значение true, во время расчета CTC элементы, выходные последовательности которых длиннее, чем входные, пропускаются: они не способствуют возникновению потерь и имеют нулевой градиент.

public Выход <Float> loss ()

Вектор (пакет), содержащий логарифмические вероятности.

public static CTCLossV2.Options preprocessCollapseRepeated (логическое значение preprocessCollapseRepeated)

Параметры
предварительная обработкаСвернутьПовторенный Скаляр, если true, то повторяющиеся метки сворачиваются перед вычислением CTC.