BoostedAğaçlarSeyrekHesaplaEn İyiÖzellikBölme

genel final sınıfı BoostedTreesSparseCalculateBestFeatureSplit

Her özellik için kazançları hesaplar ve özellik için mümkün olan en iyi bölünmüş bilgiyi döndürür.

Bölünmüş bilgiler, her özellik için en iyi eşik (paket kimliği), kazançlar ve düğüm başına sol/sağ düğüm katkılarıdır.

Her bir özelliğe göre tüm düğümlerin bölünememesi mümkündür. Bu nedenle olası düğümlerin listesi özellikler arasında farklılık gösterebilir. Bu nedenle, her özellik için, bu özelliğin bölmek için kullanılabileceği düğümlerin listesini içeren 'node_ids_list'i döndürürüz.

Bu şekilde, çıktı, özellik başına ve düğüm başına en iyi bölünmedir, böylece her düğüm için (olası tüm özellikler arasında) en iyi bölünmeyi üretmek için daha sonra birleştirilmesi gerekir.

Çıkış şekilleri, tüm tensörlerin ilk boyutu aynı olacak ve her özellik için olası bölünmüş düğümlerin sayısına eşit olacak şekilde uyumludur.

İç İçe Sınıflar

sınıf BoostedTreesSparseHesaplaEn İyi ÖzellikSplit.Options BoostedTreesSparseCalculateBestFeatureSplit için isteğe bağlı özellikler

Genel Yöntemler

statik GüçlendirilmişAğaçlarSparseHesaplaEn İyiÖzellikBölme
create ( Kapsam kapsamı, İşlenen <Tamsayı> nodeIdRange, İşlenen <Tamsayı> statsSummaryIndices, İşlenen <Float> statsSummaryValues, İşlenen <Tamsayı> statsSummaryShape, İşlenen <Float> l1, İşlenen <Float> l2, İşlenen <Float> ağaç Karmaşıklığı, İşlenen <Float > minNodeWeight, Long logitsDimension, Seçenekler... seçenekler)
Yeni bir BoostedTreesSparseCalculateBestFeatureSplit işlemini saran bir sınıf oluşturmaya yönelik fabrika yöntemi.
Çıkış <Tamsayı>
özellikBoyutlar ()
Her düğüm için bölünecek her özelliğin en iyi özellik boyutunu gösteren Derece 1 tensör.
Çıkış <Kamanma>
kazançlar ()
Her düğümü bölmek için en iyi kazanımları gösteren Derece 1 tensör.
Çıkış <Kamanma>
leftNodeKatkılar ()
Her özellik için verilen eşiğe göre ana düğümlerden sol yöne doğru dallanırken sol düğümlerin katkısını gösteren 2. Derece tensör.
Çıkış <Tamsayı>
düğüm kimlikleri ()
Bölünebilecek olası düğüm kimliklerini gösteren Derece 1 tensör.
Çıkış <Kamanma>
rightNodeKatkılar ()
left_node_contribs_list ile aynı şekle/koşullara sahip, ancak yalnızca değerin sağ düğüm için olduğu Derece 2 tensör.
static BoostedTreesSparseCalculateBestFeatureSplit.Options
splitType (Dize splitType)
Çıkış <Dize>
splitWithDefaultDirections ()
Veri eksikse hangi yöne gidileceğini gösteren Derece 1 tensör.
Çıkış <Tamsayı>
eşikler ()
Her düğümde bölme için karşılaştırılacak paket kimliğini (eşik olarak) belirten Derece 1 tensör.

Kalıtsal Yöntemler

Genel Yöntemler

public static BoostedTreesSparseCalculateBestFeatureSplit create ( Kapsam kapsamı, İşlenen <Tamsayı> nodeIdRange, İşlenen <Tamsayı> statsSummaryIndices, İşlenen <Float> statsSummaryValues, İşlenen <Tamsayı> statsSummaryShape, İşlenen <Float> l1, İşlenen <Float> l2, İşlenen <Float>treeComplex gerçeklik , İşlenen <Float> minNodeWeight, Long logitsDimension, Options... seçenekler)

Yeni bir BoostedTreesSparseCalculateBestFeatureSplit işlemini saran bir sınıf oluşturmaya yönelik fabrika yöntemi.

Parametreler
kapsam mevcut kapsam
nodeIdRange 'stats_summary_list' içinde işlenecek düğüm kimliklerinin aralığını [ilk, son) belirtmek için Derece 1 tensörü (şekil=[2]). Düğümler, tensör tarafından belirtilen iki düğüm arasında, 'for node_id in range(node_id_range[0], node_id_range[1])' gibi yinelenir (Son indeks node_id_range[1]'in özel olduğunu unutmayın).
istatistiklerÖzetEndeksler Her özellik için paket başına düğüm başına birikmiş istatistik özeti (gradyan/hessian) için yoğun şekilli [N, 4] (N, sıfır olmayan değerlerin sayısını belirtir) Rank 2 int64 tensörü. İkinci boyut, düğüm kimliğini, özellik boyutunu, paket kimliğini ve loş istatistikleri içerir. stats dim, logit boyutu ile kendir boyutunun toplamıdır; kendir boyutu, çapraz kendir kullanılırsa logit boyutu olabilir veya tam kendir kullanılırsa logit boyutu^2 olabilir.
istatistiklerÖzetDeğerler Özet_indislerdeki her öğe için değerleri sağlayan yoğun şekilli [N] (N, sıfır olmayan değerlerin sayısını belirtir) Derece 1 kayan nokta tensörü.
istatistiklerÖzetŞekil Seyrek tensörün yoğun şeklini belirten, [sayı ağaç düğümleri, özellik boyutları, sayı paketleri, istatistikler sönük] olan yoğun şekilli bir Derece 1 kayan nokta tensörü [4].
l1 Örnek bazında yaprak ağırlıklarına ilişkin l1 düzenleme faktörü.
l2 Örnek bazında yaprak ağırlıklarına ilişkin l2 düzenleme faktörü.
ağaçKarmaşıklık yaprak bazında kazanç ayarı.
minNodeWeight Düğümün bölünme için dikkate alınması için gerekli olan düğümdeki minimum hessian ortalaması.
logitsBoyut Logit boyutu, yani sınıf sayısı.
seçenekler isteğe bağlı nitelik değerlerini taşır
İadeler
  • BoostedTreesSparseCalculateBestFeatureSplit'in yeni bir örneği

public Output <Integer> featureDimensions ()

Her düğüm için bölünecek her özelliğin en iyi özellik boyutunu gösteren Derece 1 tensör.

public Çıkış <Float> kazançları ()

Her düğümü bölmek için en iyi kazanımları gösteren Derece 1 tensör.

public Çıktı <Float> leftNodeContribs ()

Her özellik için verilen eşiğe göre ana düğümlerden sol yöne doğru dallanırken sol düğümlerin katkısını gösteren 2. Derece tensör. Bu değer, üst düğüm değerine eklenerek sol düğüm değerini oluşturmak için kullanılacaktır. İkinci boyut boyutu logit boyutudur.

genel Çıkış <Tamsayı> nodeIds ()

Bölünebilecek olası düğüm kimliklerini gösteren Derece 1 tensör.

public Çıkış <Float> rightNodeContribs ()

left_node_contribs_list ile aynı şekle/koşullara sahip, ancak yalnızca değerin sağ düğüm için olduğu Derece 2 tensör.

public static BoostedTreesSparseCalculateBestFeatureSplit.Options splitType (Dize splitType)

Parametreler
splitType Bu Op'un eşitsizlik bölmesi mi yoksa eşitlik bölmesi mi yapması gerektiğini belirten bir dize.

public Output <String> splitWithDefaultDirections ()

Veri eksikse hangi yöne gidileceğini gösteren Derece 1 tensör. Varsayılan sol ile eşitsizlik 0 değerini, varsayılan sağ ile eşitsizlik 1'i, varsayılan sağ ile eşitlik 2 değerini döndürür.

genel Çıkış <Tamsayı> eşikleri ()

Her düğümde bölme için karşılaştırılacak paket kimliğini (eşik olarak) belirten Derece 1 tensör.