BoostedTreesCalculateBestFeatureSplitV2

lớp cuối cùng công khai BoostedTreesCalculateBestFeatureSplitV2

Tính toán mức tăng cho từng tính năng và trả về thông tin phân chia tốt nhất có thể cho mỗi nút. Tuy nhiên, nếu không tìm thấy sự phân chia thì không có thông tin phân chia nào được trả về cho nút đó.

Thông tin phân chia là ngưỡng tốt nhất (id nhóm), mức tăng và đóng góp của nút trái/phải trên mỗi nút cho từng tính năng.

Có thể không phải tất cả các nút đều có thể được phân chia trên mỗi tính năng. Do đó, danh sách các nút có thể có có thể khác nhau giữa các tính năng. Do đó, chúng tôi trả về `node_ids_list` cho mỗi tính năng, chứa danh sách các nút mà tính năng này có thể được sử dụng để phân tách.

Theo cách này, đầu ra là sự phân chia tốt nhất cho mỗi tính năng và trên mỗi nút, do đó nó cần được kết hợp sau này để tạo ra sự phân chia tốt nhất cho mỗi nút (trong số tất cả các tính năng có thể có).

Các hình dạng đầu ra tương thích theo cách mà chiều thứ nhất của tất cả các tensor đều giống nhau và bằng số lượng nút phân chia có thể có cho mỗi tính năng.

Phương pháp công khai

tĩnh BoostedTreesCalculateBestFeatureSplitV2
tạo ( Phạm vi phạm vi, Toán hạng <Integer> nodeIdRange, Iterable< Toán hạng <Float>> statsSummariesList, Toán hạng <String> SplitTypes, Toán hạng <Integer> ứng cử viênFeatureIds, Toán hạng <Float> l1, Toán hạng <Float> l2, Toán hạng <Float> treeComplexity, Toán hạng <Float> minNodeWeight, Nhật ký dài Kích thước)
Phương thức gốc để tạo một lớp bao gồm một thao tác BoostedTreesCalculateBestFeatureSplitV2 mới.
Đầu ra <Số nguyên>
tính năngKích thước ()
Thang đo Hạng 1 biểu thị thứ nguyên đối tượng tốt nhất để mỗi đối tượng được phân chia cho các nút nhất định nếu đối tượng địa lý đó có nhiều chiều.
Đầu ra <Số nguyên>
featureId ()
Thang đo Hạng 1 cho biết id tính năng tốt nhất cho mỗi nút.
Đầu ra <Float>
lợi nhuận ()
Tenxor Hạng 1 biểu thị mức tăng tốt nhất cho từng tính năng được phân chia cho các nút nhất định.
Đầu ra <Float>
leftNodeContrib ()
Một tensor hạng 2 biểu thị sự đóng góp của các nút bên trái khi phân nhánh từ các nút cha (được cung cấp bởi phần tử tensor trong node_ids_list đầu ra) sang hướng trái theo ngưỡng nhất định cho từng tính năng.
Đầu ra <Số nguyên>
nútId ()
Thang đo Hạng 1 biểu thị các id nút phân chia có thể có cho từng đối tượng địa lý.
Đầu ra <Float>
rightNodeContribs ()
Một tensor Hạng 2, có hình dạng/điều kiện giống như left_node_contribs_list, nhưng giá trị đó chỉ dành cho nút bên phải.
Đầu ra <Chuỗi>
chiaWithDefaultDirections ()
Tenxơ Hạng 1 cho biết hướng đi nếu thiếu dữ liệu.
Đầu ra <Số nguyên>
ngưỡng ()
Thang đo Hạng 1 cho biết id nhóm để so sánh với (dưới dạng ngưỡng) để phân chia trong mỗi nút.

Phương pháp kế thừa

Phương pháp công khai

public static BoostedTreesCalculateBestFeatureSplitV2 tạo ( Phạm vi phạm vi, Toán hạng <Integer> nodeIdRange, Iterable< Toán hạng <Float>> statsSummariesList, Toán hạng <String> SplitTypes, Toán hạng <Integer> ứng cử viênFeatureIds, Toán hạng <Float> l1, Toán hạng <Float> l2 , Toán hạng <Float > treeComplexity, Operand <Float> minNodeWeight, Long logitsDimension)

Phương thức gốc để tạo một lớp bao gồm một thao tác BoostedTreesCalculateBestFeatureSplitV2 mới.

Thông số
phạm vi phạm vi hiện tại
nútIdRange Một tensor Hạng 1 (shape=[2]) để chỉ định phạm vi [đầu tiên, cuối cùng) của id nút cần xử lý trong `stats_summary_list`. Các nút được lặp lại giữa hai nút được chỉ định bởi tensor, giống như `for node_id in range(node_id_range[0], node_id_range[1])` (Lưu ý rằng chỉ mục cuối cùng node_id_range[1] là độc quyền).
số liệu thống kêTóm tắtDanh sách Danh sách tensor Hạng 4 (#shape=[max_splits, feature_dims, xô, stats_dims]) để tóm tắt số liệu thống kê tích lũy (gradient/hessian) trên mỗi nút, trên mỗi thứ nguyên, trên mỗi nhóm cho mỗi tính năng. Kích thước đầu tiên của tensor là số lượng phân chia tối đa và do đó không phải tất cả các phần tử của nó sẽ được sử dụng mà chỉ các chỉ mục được chỉ định bởi node_ids sẽ được sử dụng.
loại chia Một tenxơ Hạng 1 cho biết liệu Op này có nên thực hiện phân chia bất đẳng thức hay phân chia đẳng thức cho mỗi đối tượng địa lý hay không.
Id tính năng ứng viên Tenor xếp hạng 1 với id cho mỗi tính năng. Đây là id thực sự của tính năng này.
l1 l1 hệ số chính quy hóa trên trọng số của lá, dựa trên từng trường hợp.
l2 l2 hệ số chính quy hóa trên trọng số của lá, dựa trên từng trường hợp.
câyĐộ phức tạp điều chỉnh mức tăng, dựa trên mỗi lá.
phútNodeWeight mức trung bình tối thiểu của số hessians trong một nút trước khi được yêu cầu để nút đó được xem xét phân tách.
logitsKích thước Thứ nguyên của logit, tức là số lượng lớp.
Trả lại
  • một phiên bản mới của BoostedTreesCalculateBestFeatureSplitV2

public Output <Integer> featureDimensions ()

Thang đo Hạng 1 biểu thị thứ nguyên đối tượng tốt nhất để mỗi đối tượng được phân chia cho các nút nhất định nếu đối tượng địa lý đó có nhiều chiều. Xem ở trên để biết chi tiết như hình dạng và kích thước.

Đầu ra công khai <Integer> featureIds ()

Thang đo Hạng 1 cho biết id tính năng tốt nhất cho mỗi nút. Xem ở trên để biết chi tiết như hình dạng và kích thước.

Đầu ra công khai <Float> tăng ()

Tenxor Hạng 1 biểu thị mức tăng tốt nhất cho từng tính năng được phân chia cho các nút nhất định. Xem ở trên để biết chi tiết như hình dạng và kích thước.

Đầu ra công khai <Float> leftNodeContribs ()

Một tensor hạng 2 biểu thị sự đóng góp của các nút bên trái khi phân nhánh từ các nút cha (được cung cấp bởi phần tử tensor trong node_ids_list đầu ra) sang hướng trái theo ngưỡng nhất định cho từng tính năng. Giá trị này sẽ được sử dụng để tạo giá trị nút bên trái bằng cách cộng vào giá trị nút cha. Kích thước chiều thứ hai là 1 đối với logit 1 chiều, nhưng sẽ lớn hơn đối với các bài toán nhiều lớp. Xem ở trên để biết chi tiết như hình dạng và kích thước.

Đầu ra công khai <Số nguyên> nodeIds ()

Thang đo Hạng 1 biểu thị các id nút phân chia có thể có cho từng đối tượng địa lý. Độ dài của danh sách là num_features, nhưng mỗi tensor có kích thước khác nhau vì mỗi tính năng cung cấp các nút có thể khác nhau. Xem ở trên để biết chi tiết như hình dạng và kích thước.

Đầu ra công khai <Float> rightNodeContribs ()

Một tensor Hạng 2, có hình dạng/điều kiện giống như left_node_contribs_list, nhưng giá trị đó chỉ dành cho nút bên phải.

Đầu ra công khai <String> SplitWithDefaultDirections ()

Tenxơ Hạng 1 cho biết hướng đi nếu thiếu dữ liệu. Xem ở trên để biết chi tiết như hình dạng và kích thước. Bất đẳng thức mặc định bên trái trả về 0, bất đẳng thức mặc định bên phải trả về 1, đẳng thức mặc định bên phải trả về 2.

Ngưỡng đầu ra công khai < Số nguyên> ()

Thang đo Hạng 1 cho biết id nhóm để so sánh với (dưới dạng ngưỡng) để phân chia trong mỗi nút. Xem ở trên để biết chi tiết như hình dạng và kích thước.