각 기능에 대한 이득을 계산하고 기능에 대한 최상의 분할 정보를 반환합니다.
분할 정보는 각 기능에 대한 노드 당 최고의 임계 값 (버킷 ID), 이득 및 왼쪽/오른쪽 노드 기여입니다.
각 기능에서 모든 노드를 분할 할 수있는 것은 아닙니다. 따라서 가능한 노드 목록은 기능마다 다를 수 있습니다. 따라서이 기능을 분할하는 데 사용될 수있는 노드 목록을 포함하여 각 기능에 대해`node_ids_list`를 반환합니다.
이러한 방식으로, 출력은 피처 및 노드 당 최고의 분할이므로 나중에 각 노드에 대한 최고의 분할을 생성하기 위해 나중에 결합해야합니다 (가능한 모든 기능 중).
출력 모양은 모든 텐서의 첫 번째 차원이 동일하고 각 기능에 대한 가능한 분할 노드의 수와 동일하게 호환됩니다.
중첩 클래스
수업 | boostedTreessParsEcalculateBestFeaturesPlit.Options | BoostedTreesSparseCalculateBestFeatureSplit 의 선택적 속성 |
공개 방법
정적 BoostedTreessParsEcalculateBestFeaturesPlit | 생성 ( 스코프 스코프, 오페라 <integer> nodeidrange, 오페라 <integer> statssummaryindices, operand <float> statssummaryvalues, operand <integer> statssummaryshape, operand <float> l1, operand <float> l2, operand > l2, treecomplexity, offerand < float > Minnodeweight, 긴 logitsdimension, 옵션 ... 옵션) 공장 방법 새로운 boostedtreessparsecalculateBestFeaturesPlit 작업을 감싸는 클래스를 생성하는 방법. |
출력 <정수> | featuredimensions () 각 기능에 대한 최상의 기능 차원을 나타내는 순위 1 텐서. 각 노드에 대해 분할됩니다. |
출력 <플로트> | gains () 각 노드를 분할하기위한 최상의 이익을 나타내는 순위 1 텐서. |
출력 <플로트> | LeftNodecontribs () 각 기능에 대한 주어진 임계 값에 의해 부모 노드에서 왼쪽 방향으로 분기 될 때 왼쪽 노드의 기여를 나타내는 순위 2 텐서. |
출력 <정수> | nodeids () 분할 할 수있는 노드 ID를 나타내는 순위 1 텐서. |
출력 <플로트> | RightNodecontribs () Left_node_contribs_list와 동일한 모양/조건을 가진 순위 2 텐서이지만 값은 오른쪽 노드에 대한 것입니다. |
정적 BoostedTreessParsEcalculateBestFeaturesPlit.Options | splittype (String splittype) |
출력 <문자열> | splitwithDefaultDirections () 데이터가 누락 된 경우 어느 방향으로 가야하는지 나타내는 순위 1 텐서. |
출력 <정수> | 임계 값 () 버킷 ID가 각 노드에서 분할의 임계 값으로 비교할 수있는 순위 1 텐서. |
상속된 메서드
공개 방법
Public STATIC BOSTEDTREESSPARSCALCULATEBESTFEATURESPLIT CREATE ( SCOPE SCOPE, OPERAND <INTEGER> NODEIDRANGE, OPERAND <INTEGER> STATSSUMMARYINDICES, OPERAND > STATSSUMMARYVALUES, OPERAND <ETEGER> StatsSummaryShape, Operand > L1, Operand <L2, Operand > Operand <Float> MinnodeWeight, 긴 logitsdimension, 옵션 ... 옵션)
공장 방법 새로운 boostedtreessparsecalculateBestFeaturesPlit 작업을 감싸는 클래스를 생성하는 방법.
매개변수
범위 | 현재 범위 |
---|---|
NodeIdRange | `stats_summary_list` 내에서 처리 할 노드 ID의 [첫 번째, 마지막) 범위를 지정하는 순위 1 텐서 (shape = [2]). 노드는``node_id의 for node_id_range [0], node_id_range [1])와 같이 텐서가 지정한 두 노드 사이에 반복됩니다 (마지막 인덱스 node_id_range [1]은 독점적이라는 점에 유의하십시오. |
STATSSUMMARYINDICES | 각 기능에 대한 버킷 당 노드 당 누적 된 통계 요약 (Gradient/Hessian)에 대한 밀도가 높은 모양 [n, 4] (N, 0이 아닌 값의 수를 지정)의 순위 2 int64 텐서. 두 번째 차원에는 노드 ID, 기능 치수, 버킷 ID 및 통계가 포함됩니다. 통계 Dim은 Logits Dimension과 Hessian Dimension의 합입니다. Hessian Dimension은 Diagonal Hessian을 사용하는 경우 Logits Dimension 일 수 있거나 Logits Dimension^2 Full Hessian을 사용하는 경우 2 차원^2입니다. |
STATSSUMMARYVALUES | 밀도가 높은 모양 [n] (n]의 순위 1 플로트 텐서는 Summary_Indices에서 각 요소의 값을 제공합니다. |
STATSSUMMARY SHAPE | 조밀 한 모양의 랭크 1 플로트 텐서 [4]. [Num 트리 노드, 특징 치수, Num 버킷, 스탯 희미한 스파 스 텐서의 조밀 한 모양을 지정합니다. |
l1 | 인스턴스 기반 잎 무게에 대한 L1 정규화 계수. |
L2 | 인스턴스 기반 잎 무게에 대한 L2 정규화 계수. |
treecomplexity | 잎 기반의 게인에 대한 조정. |
Minnodeweight | 노드에서 분할을 고려하기 전에 노드에있는 Hessians의 최소 AVG. |
logitsdimension | 로이트의 차원, 즉 클래스 수. |
옵션 | 선택적 속성 값을 전달합니다. |
보고
- BoostedTreessParsEcalculateBestFeaturesPlit의 새로운 인스턴스
공개 출력 <Float> leftnodecontribs ()
각 기능에 대한 주어진 임계 값에 의해 부모 노드에서 왼쪽 방향으로 분기 될 때 왼쪽 노드의 기여를 나타내는 순위 2 텐서. 이 값은 부모 노드 값에 추가하여 왼쪽 노드 값을 만드는 데 사용됩니다. 2 차원 크기는 로짓 치수입니다.
공개 출력 <Float> RightNodeContribs ()
Left_node_contribs_list와 동일한 모양/조건을 가진 순위 2 텐서이지만 값은 오른쪽 노드에 대한 것입니다.
public static boostedtreessparsecalculatebestfeatplit.options splittype (String splittype)
매개변수
분할 유형 | 이 OP가 불평등 분할 또는 평등 분할을 수행 해야하는지 여부를 나타내는 문자열. |
---|
공개 출력 <string> splitwithDefaultDirections ()
데이터가 누락 된 경우 어느 방향으로 가야하는지 나타내는 순위 1 텐서. 기본값이있는 불평등은 0, 기본 오른쪽 반품 1의 불평등, 기본 오른쪽 반환의 평등 2.