BoostedTreesSparseCalculateBestFeatureSplit

публичный финальный класс BoostedTreesSparseCalculateBestFeatureSplit

Вычисляет выигрыш для каждой функции и возвращает наилучшую возможную информацию о разбиении для этой функции.

Информация о разделении представляет собой лучший порог (идентификатор сегмента), приросты и вклады левого/правого узла на узел для каждого объекта.

Возможно, не все узлы можно разделить по каждому признаку. Следовательно, список возможных узлов может различаться в зависимости от объекта. Поэтому мы возвращаем node_ids_list для каждого объекта, содержащий список узлов, для разделения которых можно использовать этот объект.

Таким образом, выходные данные представляют собой наилучшее разделение по объектам и узлам, поэтому их необходимо объединить позже, чтобы получить наилучшее разделение для каждого узла (среди всех возможных функций).

Выходные формы совместимы таким образом, что первое измерение всех тензоров одинаково и равно количеству возможных узлов разделения для каждого объекта.

Вложенные классы

сорт BoostedTreesSparseCalculateBestFeatureSplit.Options Необязательные атрибуты для BoostedTreesSparseCalculateBestFeatureSplit

Публичные методы

static BoostedTreesSparseCalculateBestFeatureSplit
create ( Область видимости , Операнд <Integer> nodeIdRange, Операнд <Integer> statsSummaryIndices, Операнд <Float> statsSummaryValues, Операнд <Integer> statsSummaryShape, Операнд <Float> l1, Операнд <Float> l2, Операнд <Float> TreeComplexity, Операнд <Float > minNodeWeight, Long logitsDimension, Параметры... параметры)
Фабричный метод для создания класса, обертывающего новую операцию BoostedTreesSparseCalculateBestFeatureSplit.
Вывод <Целое число>
функцияРазмеры ()
Тензор ранга 1, указывающий наилучшее измерение объекта для каждого объекта, который можно разделить для каждого узла.
Выход <С плавающей запятой>
прибыль ()
Тензор ранга 1, указывающий наилучший выигрыш для разделения каждого узла.
Выход <С плавающей запятой>
левыйNodeContribs ()
Тензор ранга 2, указывающий вклад левых узлов при разветвлении от родительских узлов влево по заданному порогу для каждого признака.
Вывод <Целое число>
идентификаторы узлов ()
Тензор ранга 1, указывающий возможные идентификаторы узлов, которые можно разделить.
Выход <С плавающей запятой>
rightNodeContribs ()
Тензор ранга 2 с той же формой/условиями, что и left_node_contribs_list, но значение предназначено только для правого узла.
статический BoostedTreesSparseCalculateBestFeatureSplit.Options
SplitType (строка SplitType)
Вывод <Строка>
сплитвисдефолтдиректионс ()
Тензор ранга 1, указывающий, в каком направлении двигаться, если данные отсутствуют.
Вывод <Целое число>
пороги ()
Тензор ранга 1, указывающий идентификатор сегмента для сравнения (в качестве порога) для разделения в каждом узле.

Унаследованные методы

Публичные методы

public static BoostedTreesSparseCalculateBestFeatureSplit create ( Область действия, Operand <Integer> nodeIdRange, Operand <Integer> statsSummaryIndices, Operand <Float> statsSummaryValues, Operand <Integer> statsSummaryShape, Operand <Float> l1, Operand <Float> l2, Operand <Float> TreeComplex итность, Операнд <Float> minNodeWeight, Long logitsDimension, Options... options)

Фабричный метод для создания класса, обертывающего новую операцию BoostedTreesSparseCalculateBestFeatureSplit.

Параметры
объем текущий объем
узелидранже Тензор ранга 1 (shape=[2]) для указания диапазона [первый, последний) идентификаторов узлов для обработки в `stats_summary_list`. Узлы перебираются между двумя узлами, указанными тензором, как например `for node_id в диапазоне(node_id_range[0], node_id_range[1])` (обратите внимание, что последний индекс node_id_range[1] является исключительным).
статистикаСводкаИндексы Тензор int64 ранга 2 плотной формы [N, 4] (N указывает количество ненулевых значений) для накопленной сводки статистики (градиент/гессиан) для каждого узла в сегменте для каждого объекта. Второе измерение содержит идентификатор узла, измерение функции, идентификатор сегмента и размер статистики. stats dim — это сумма размерности логитов и размерности гессиана, размерность гессиана может быть либо размерностью логитов, если используется диагональный гессиан, либо размером логитов^2, если используется полный гессиан.
статистикаСводкаЦенности Тензор с плавающей запятой ранга 1 плотной формы [N] (N указывает количество ненулевых значений), который предоставляет значения для каждого элемента в summary_indices.
статистикаСводкаФорма Тензор с плавающей запятой ранга 1 плотной формы [4], который определяет плотную форму разреженного тензора, то есть [количество узлов дерева, размеры объектов, количество сегментов, тусклая статистика].
л1 Коэффициент регуляризации l1 для весов листьев, в зависимости от экземпляра.
л2 Коэффициент регуляризации l2 для весов листьев, в зависимости от экземпляра.
деревоСложность регулировка усиления на основе листа.
minNodeWeight минимальное среднее количество гессианов в узле, необходимое для того, чтобы узел можно было рассматривать для разделения.
логитыразмерность Размерность логита, т. е. количества классов.
параметры содержит значения необязательных атрибутов
Возврат
  • новый экземпляр BoostedTreesSparseCalculateBestFeatureSplit

публичный вывод <Integer> FeatureDimensions ()

Тензор ранга 1, указывающий наилучшее измерение объекта для каждого объекта, который можно разделить для каждого узла.

public Output <Float> прирост ()

Тензор ранга 1, указывающий наилучший выигрыш для разделения каждого узла.

публичный вывод <Float> leftNodeContribs ()

Тензор ранга 2, указывающий вклад левых узлов при разветвлении от родительских узлов влево по заданному порогу для каждого признака. Это значение будет использоваться для создания значения левого узла путем добавления к значению родительского узла. Второй размер измерения - это размерность логитов.

общедоступный вывод <Integer> nodeIds ()

Тензор ранга 1, указывающий возможные идентификаторы узлов, которые можно разделить.

публичный вывод <Float> rightNodeContribs ()

Тензор ранга 2 с той же формой/условиями, что и left_node_contribs_list, но значение предназначено только для правого узла.

общедоступный статический BoostedTreesSparseCalculateBestFeatureSplit.Options SplitType (String SplitType)

Параметры
тип разделения Строка, указывающая, должна ли эта операция выполнять разделение по неравенству или разделение по равенству.

общедоступный вывод <String> SplitWithDefaultDirections ()

Тензор ранга 1, указывающий, в каком направлении двигаться, если данные отсутствуют. Неравенство с левым по умолчанию возвращает 0, неравенство с правым по умолчанию возвращает 1, равенство с правым по умолчанию возвращает 2.

общедоступные пороговые значения вывода <Integer> ()

Тензор ранга 1, указывающий идентификатор сегмента для сравнения (в качестве порога) для разделения в каждом узле.