BoostedTreesCalculateBestFeatureSplit

kelas akhir publik BoostedTreesCalculateBestFeatureSplit

Menghitung keuntungan untuk setiap fitur dan mengembalikan informasi pemisahan terbaik untuk fitur tersebut.

Informasi yang dipisahkan adalah ambang batas terbaik (id keranjang), perolehan, dan kontribusi node kiri/kanan per node untuk setiap fitur.

Ada kemungkinan tidak semua node dapat dipecah pada setiap fitur. Oleh karena itu, daftar kemungkinan node dapat berbeda antar fitur. Oleh karena itu, kami mengembalikan `node_ids_list` untuk setiap fitur, yang berisi daftar node yang dapat digunakan untuk dipisahkan oleh fitur ini.

Dengan cara ini, outputnya adalah pemisahan terbaik per fitur dan per node, sehingga nantinya perlu digabungkan untuk menghasilkan pemisahan terbaik untuk setiap node (di antara semua fitur yang mungkin).

Bentuk keluaran kompatibel sedemikian rupa sehingga dimensi pertama semua tensor sama dan sama dengan jumlah kemungkinan node terpisah untuk setiap fitur.

Kelas Bersarang

kelas BoostedTreesCalculateBestFeatureSplit.Options Atribut opsional untuk BoostedTreesCalculateBestFeatureSplit

Metode Publik

BoostedTreesCalculateBestFeatureSplit statis
buat ( Lingkup cakupan, Operan <Integer> nodeIdRange, Operan <Float> statsSummary, Operan <Float> l1, Operan <Float> l2, Operan <Float> treeComplexity, Operan <Float> minNodeWeight, LogitsDimension Panjang, Opsi... opsi)
Metode pabrik untuk membuat kelas yang membungkus operasi BoostedTreesCalculateBestFeatureSplit baru.
Keluaran <Bilangan Bulat>
fiturDimensi ()
Tensor Peringkat 1 yang menunjukkan dimensi fitur terbaik untuk setiap fitur yang akan dipisahkan untuk node tertentu jika fitur tersebut multidimensi.
Keluaran <Mengambang>
keuntungan ()
Tensor Peringkat 1 yang menunjukkan perolehan terbaik untuk setiap fitur yang akan dibagi untuk node tertentu.
Keluaran <Mengambang>
kiriNodeContribs ()
Tensor peringkat 2 yang menunjukkan kontribusi node kiri ketika bercabang dari node induk (diberikan oleh elemen tensor di output node_ids_list) ke arah kiri dengan ambang batas yang diberikan untuk setiap fitur.
Keluaran <Bilangan Bulat>
nodeId ()
Tensor Peringkat 1 yang menunjukkan kemungkinan id node terpisah untuk setiap fitur.
Keluaran <Mengambang>
kananNodeContribs ()
Tensor peringkat 2, dengan bentuk/kondisi yang sama dengan left_node_contribs_list, tetapi nilainya hanya untuk node kanan.
BoostedTreesCalculateBestFeatureSplit.Options statis
splitType (String splitType)
Keluaran <String>
splitDenganDefaultDirections ()
Tensor Peringkat 1 yang menunjukkan arah mana yang harus dituju jika data hilang.
Keluaran <Bilangan Bulat>
ambang batas ()
Tensor Peringkat 1 yang menunjukkan id keranjang yang akan dibandingkan (sebagai ambang batas) untuk pemisahan di setiap node.

Metode Warisan

Metode Publik

public static BoostedTreesCalculateBestFeatureSplit buat ( Cakupan lingkup , Operand <Integer> nodeIdRange, Operand <Float> statsSummary, Operand <Float> l1, Operand <Float> l2, Operand <Float> treeComplexity, Operand <Float> minNodeWeight, LogitsDimension panjang, Opsi.. . pilihan)

Metode pabrik untuk membuat kelas yang membungkus operasi BoostedTreesCalculateBestFeatureSplit baru.

Parameter
cakupan ruang lingkup saat ini
nodeIdRange Tensor Peringkat 1 (bentuk=[2]) untuk menentukan rentang [pertama, terakhir) dari id node yang akan diproses dalam `stats_summary_list`. Node diiterasi antara dua node yang ditentukan oleh tensor, seperti `untuk node_id dalam rentang(node_id_range[0], node_id_range[1])` (Perhatikan bahwa indeks terakhir node_id_range[1] bersifat eksklusif).
statistikRingkasan Tensor Peringkat 4 (#shape=[max_splits, feature_dims, bucket, stats_dims]) untuk akumulasi ringkasan statistik (gradien/hessian) per node, per dimensi, per bucket untuk setiap fitur. Dimensi pertama tensor adalah jumlah pemisahan maksimum, sehingga tidak semua elemennya akan digunakan, tetapi hanya indeks yang ditentukan oleh node_ids yang akan digunakan.
l1 l1 faktor regularisasi pada bobot daun, berdasarkan per contoh.
l2 l2 faktor regularisasi pada bobot daun, berdasarkan per contoh.
kompleksitas pohon penyesuaian terhadap keuntungan, berdasarkan per daun.
minNodeBerat rata-rata minimum goni dalam sebuah node sebelum diperlukan agar node tersebut dipertimbangkan untuk dipecah.
LogitsDimensi Dimensi logit, yaitu jumlah kelas.
pilihan membawa nilai atribut opsional
Kembali
  • contoh baru dari BoostedTreesCalculateBestFeatureSplit

Output publik <Integer> featureDimensions ()

Tensor Peringkat 1 yang menunjukkan dimensi fitur terbaik untuk setiap fitur yang akan dipisahkan untuk node tertentu jika fitur tersebut multidimensi. Lihat di atas untuk detail seperti bentuk dan ukuran.

Output publik <Float> keuntungan ()

Tensor Peringkat 1 yang menunjukkan perolehan terbaik untuk setiap fitur yang akan dibagi untuk node tertentu. Lihat di atas untuk detail seperti bentuk dan ukuran.

Keluaran publik <Float> leftNodeContribs ()

Tensor peringkat 2 yang menunjukkan kontribusi node kiri ketika bercabang dari node induk (diberikan oleh elemen tensor di output node_ids_list) ke arah kiri dengan ambang batas yang diberikan untuk setiap fitur. Nilai ini akan digunakan untuk membuat nilai simpul kiri dengan menambahkan nilai simpul induk. Ukuran dimensi kedua adalah 1 untuk logit 1 dimensi, tetapi akan lebih besar untuk masalah kelas jamak. Lihat di atas untuk detail seperti bentuk dan ukuran.

Keluaran publik <Bilangan Bulat> nodeIds ()

Tensor Peringkat 1 yang menunjukkan kemungkinan id node terpisah untuk setiap fitur. Panjang daftarnya adalah num_features, tetapi setiap tensor memiliki ukuran berbeda karena setiap fitur menyediakan kemungkinan node yang berbeda. Lihat di atas untuk detail seperti bentuk dan ukuran.

Keluaran publik <Float> rightNodeContribs ()

Tensor peringkat 2, dengan bentuk/kondisi yang sama dengan left_node_contribs_list, tetapi nilainya hanya untuk node kanan.

publik statis BoostedTreesCalculateBestFeatureSplit.Options splitType (String splitType)

Parameter
Tipe terpisah Sebuah string yang menunjukkan apakah Operasi ini harus melakukan pemisahan ketidaksetaraan atau pemisahan kesetaraan.

Keluaran publik <String> splitWithDefaultDirections ()

Tensor Peringkat 1 yang menunjukkan arah mana yang harus dituju jika data hilang. Lihat di atas untuk detail seperti bentuk dan ukuran. Pertidaksamaan dengan kiri bawaan menghasilkan 0, pertidaksamaan dengan kanan bawaan menghasilkan 1, persamaan dengan kanan bawaan menghasilkan 2.

ambang batas Output publik <Integer> ()

Tensor Peringkat 1 yang menunjukkan id keranjang yang akan dibandingkan (sebagai ambang batas) untuk pemisahan di setiap node. Lihat di atas untuk detail seperti bentuk dan ukuran.