BoostedTreesCalculateBestGainsPerFeature

genel final dersi BoostedTreesCalculateÖzellik Başına En İyi Kazanç

Her özellik için kazançları hesaplar ve özellik için mümkün olan en iyi bölünmüş bilgiyi döndürür.

Bölünmüş bilgiler, her özellik için en iyi eşik (paket kimliği), kazançlar ve düğüm başına sol/sağ düğüm katkılarıdır.

Her bir özelliğe göre tüm düğümlerin bölünememesi mümkündür. Bu nedenle olası düğümlerin listesi özellikler arasında farklılık gösterebilir. Bu nedenle, her özellik için, bu özelliğin bölmek için kullanılabileceği düğümlerin listesini içeren 'node_ids_list'i döndürürüz.

Bu şekilde, çıktı, özellik başına ve düğüm başına en iyi bölünmedir, böylece her düğüm için (olası tüm özellikler arasında) en iyi bölünmeyi üretmek için daha sonra birleştirilmesi gerekir.

Çıktı listelerinin uzunluğu aynı uzunluktadır, yani "num_features". Çıktı şekilleri, tüm listelerin tüm tensörlerinin ilk boyutunun aynı olacağı ve her özellik için olası bölünmüş düğümlerin sayısına eşit olacağı şekilde uyumludur.

Genel Yöntemler

Statik GüçlendirilmişAğaçlarHesaplaÖzellik Başına En İyi Kazanç
create ( Kapsam kapsamı, İşlenen <Tamsayı> nodeIdRange, Yinelenebilir< İşlenen <Float>> statsSummaryList, İşlenen <Float> l1, İşlenen <Float> l2, İşlenen <Float> ağaç Karmaşıklığı, İşlenen <Float> minNodeWeight, Long maxSplits)
Yeni bir BoostedTreesCalculateBestGainsPerFeature işlemini saran bir sınıf oluşturmaya yönelik fabrika yöntemi.
Liste< Çıkış <Kamanma>>
kazançlarListesi ()
Belirli düğümlere bölünecek her özellik için en iyi kazanımları gösteren Derece 1 tensörlerin çıktı listesi.
Liste< Çıkış <Kamanma>>
leftNodeContribsList ()
Her özellik için verilen eşiğe göre ana düğümlerden (node_ids_list çıktısındaki tensör öğesi tarafından verilir) sol yöne dallanırken sol düğümlerin katkısını gösteren Sıra 2 tensörlerin bir listesi.
Liste< Çıkış <Tamsayı>>
düğüm kimlikleri listesi ()
Her özellik için olası bölünmüş düğüm kimliklerini gösteren Derece 1 tensörlerin çıktı listesi.
Liste< Çıkış <Kamanma>>
rightNodeContribsList ()
left_node_contribs_list ile aynı şekle/koşullara sahip, ancak yalnızca değerin sağ düğüm için olduğu Derece 2 tensörlerin listesi.
Liste< Çıkış <Tamsayı>>
eşiklerListesi ()
Her düğümde bölünme için (eşik olarak) karşılaştırılacak paket kimliğini belirten Derece 1 tensörlerin çıktı listesi.

Kalıtsal Yöntemler

Genel Yöntemler

public static BoostedTreesCalculateBestGainsPerFeature create ( Kapsam kapsamı, İşlenen <Tamsayı> nodeIdRange, Yinelenebilir< İşlenen <Float>> statsSummaryList, İşlenen <Float> l1, İşlenen <Float> l2, İşlenen <Float> ağaç Karmaşıklığı, İşlenen <Float> minNodeWeight, Long maxSplits)

Yeni bir BoostedTreesCalculateBestGainsPerFeature işlemini saran bir sınıf oluşturmaya yönelik fabrika yöntemi.

Parametreler
kapsam mevcut kapsam
nodeIdRange 'stats_summary_list' içinde işlenecek düğüm kimliklerinin aralığını [ilk, son) belirtmek için Derece 1 tensörü (şekil=[2]). Düğümler, tensör tarafından belirtilen iki düğüm arasında, "for node_id in range(node_id_range[0], node_id_range[1])" gibi yinelenir (Son indeks node_id_range[1]'in özel olduğunu unutmayın).
istatistikÖzetListe Her özellik için paket başına düğüm başına birikmiş istatistik özeti (gradyan/hessian) için Derece 3 tensör (#shape=[max_splits, bundle, 2]) listesi. Tensörün ilk boyutu maksimum bölme sayısıdır ve bu nedenle tüm elemanları kullanılmayacak, yalnızca node_ids tarafından belirtilen indeksler kullanılacaktır.
l1 Örnek bazında yaprak ağırlıklarına ilişkin l1 düzenleme faktörü.
l2 Örnek bazında yaprak ağırlıklarına ilişkin l2 düzenleme faktörü.
ağaçKarmaşıklık yaprak bazında kazanç ayarı.
minNodeWeight Düğümün bölünme için dikkate alınması için gerekli olan düğümdeki minimum hessian ortalaması.
maksimumBölmeler Ağacın tamamında bölünebilecek düğüm sayısı. Çıkış tensörlerinin boyutu olarak kullanılır.
İadeler
  • BoostedTreesCalculateBestGainsPerFeature'ın yeni bir örneği

genel Liste< Çıkış <Float>> gainsList ()

Belirli düğümlere bölünecek her özellik için en iyi kazanımları gösteren Derece 1 tensörlerin çıktı listesi. Şekiller ve boyutlar gibi ayrıntılar için yukarıya bakın.

public List< Output <Float>> leftNodeContribsList ()

Her özellik için verilen eşiğe göre ana düğümlerden (node_ids_list çıktısındaki tensör öğesi tarafından verilir) sol yöne dallanırken sol düğümlerin katkısını gösteren Sıra 2 tensörlerin bir listesi. Bu değer, üst düğüm değerine eklenerek sol düğüm değerini oluşturmak için kullanılacaktır. İkinci boyut boyutu, 1 boyutlu logitler için 1'dir, ancak çok sınıflı problemler için daha büyük olacaktır. Şekiller ve boyutlar gibi ayrıntılar için yukarıya bakın.

genel Liste< Çıkış <Tamsayı>> nodeIdsList ()

Her özellik için olası bölünmüş düğüm kimliklerini gösteren Derece 1 tensörlerin çıktı listesi. Listenin uzunluğu num_features'tır, ancak her özellik farklı olası düğümler sağladığından her tensörün farklı boyutu vardır. Şekiller ve boyutlar gibi ayrıntılar için yukarıya bakın.

genel Liste< Çıktı <Float>> rightNodeContribsList ()

left_node_contribs_list ile aynı şekil/koşullara sahip, ancak yalnızca değerin sağ düğüm için olduğu Derece 2 tensörlerin listesi.

genel Liste< Çıkış <Tamsayı>> eşiklerList ()

Her düğümde bölünme için (eşik olarak) karşılaştırılacak paket kimliğini belirten Derece 1 tensörlerin çıktı listesi. Şekiller ve boyutlar gibi ayrıntılar için yukarıya bakın.