BoostedTreesCalculateBestFeatureSplitV2

genel final dersi BoostedTreesCalculateBestFeatureSplitV2

Her özellik için kazanımları hesaplar ve her düğüm için mümkün olan en iyi bölünmüş bilgiyi döndürür. Ancak herhangi bir bölünme bulunamazsa o düğüm için hiçbir bölünme bilgisi döndürülmez.

Bölünmüş bilgiler, her özellik için en iyi eşik (paket kimliği), kazançlar ve düğüm başına sol/sağ düğüm katkılarıdır.

Her bir özelliğe göre tüm düğümlerin bölünememesi mümkündür. Bu nedenle olası düğümlerin listesi özellikler arasında farklılık gösterebilir. Bu nedenle, her özellik için, bu özelliğin bölmek için kullanılabileceği düğümlerin listesini içeren 'node_ids_list'i döndürürüz.

Bu şekilde, çıktı, özellik başına ve düğüm başına en iyi bölünmedir, böylece her düğüm için (olası tüm özellikler arasında) en iyi bölünmeyi üretmek için daha sonra birleştirilmesi gerekir.

Çıkış şekilleri, tüm tensörlerin ilk boyutu aynı olacak ve her özellik için olası bölünmüş düğümlerin sayısına eşit olacak şekilde uyumludur.

Genel Yöntemler

Statik GüçlendirilmişAğaçlarHesaplaEn İyi ÖzellikSplitV2
create ( Kapsam kapsamı, İşlenen <Tamsayı> nodeIdRange, Yinelenebilir< İşlenen <Float>> statsSummariesList, İşlenen <Dize> splitTypes, İşlenen <Tamsayı> adayFeatureIds, İşlenen <Float> l1, İşlenen <Float> l2, İşlenen <Float> ağaçKarmaşıklığı, İşlenen <Float> minNodeWeight, Long logitsDimension)
Yeni bir BoostedTreesCalculateBestFeatureSplitV2 işlemini saran bir sınıf oluşturmaya yönelik fabrika yöntemi.
Çıkış <Tamsayı>
özellikBoyutlar ()
Özelliğin çok boyutlu olması durumunda, her özelliğin belirli düğümler için bölünecek en iyi özellik boyutunu gösteren Derece 1 tensörler.
Çıkış <Tamsayı>
özellik kimlikleri ()
Her düğüm için en iyi özellik kimliğini gösteren Derece 1 tensörler.
Çıkış <Kayanma>
kazançlar ()
Belirli düğümlere bölünecek her özellik için en iyi kazanımları gösteren Derece 1 tensör.
Çıkış <Kayanma>
leftNodeKatkılar ()
Her özellik için verilen eşiğe göre ana düğümlerden (çıkış node_ids_list'teki tensör öğesi tarafından verilir) sol yöne dallanırken sol düğümlerin katkısını gösteren Sıra 2 tensörler.
Çıkış <Tamsayı>
düğüm kimlikleri ()
Her özellik için olası bölünmüş düğüm kimliklerini gösteren Derece 1 tensörler.
Çıkış <Kayanma>
rightNodeKatkılar ()
left_node_contribs_list ile aynı şekle/koşullara sahip, ancak yalnızca değerin sağ düğüm için olduğu Derece 2 tensörler.
Çıkış <Dize>
splitWithDefaultDirections ()
Veri eksikse hangi yöne gidileceğini gösteren Derece 1 tensörler.
Çıkış <Tamsayı>
eşikler ()
Her düğümde bölme için karşılaştırılacak paket kimliğini (eşik olarak) belirten Derece 1 tensörler.

Kalıtsal Yöntemler

Genel Yöntemler

public static BoostedTreesCalculateBestFeatureSplitV2 create ( Kapsam kapsamı, Operand <Integer> nodeIdRange, Iterable< Operand <Float>> statsSummariesList, Operand <String> splitTypes, Operand <Integer> adayFeatureIds, Operand <Float> l1, Operand <Float> l2, Operand <Float > TreeComplexity, Operand <Float> minNodeWeight, Long logitsDimension)

Yeni bir BoostedTreesCalculateBestFeatureSplitV2 işlemini saran bir sınıf oluşturmaya yönelik fabrika yöntemi.

Parametreler
kapsam mevcut kapsam
nodeIdRange 'stats_summary_list' içinde işlenecek düğüm kimliklerinin aralığını [ilk, son) belirtmek için Derece 1 tensörü (şekil=[2]). Düğümler, tensör tarafından belirtilen iki düğüm arasında, "for node_id in range(node_id_range[0], node_id_range[1])" gibi yinelenir (Son indeks node_id_range[1]'in özel olduğunu unutmayın).
istatistikÖzetlerListe Her özellik için düğüm başına, boyut başına, paket başına birikmiş istatistik özeti (gradyan/hessian) için Derece 4 tensör (#shape=[max_splits, feature_dims, bundle, stats_dims]) listesi. Tensörün ilk boyutu maksimum bölme sayısıdır ve bu nedenle tüm elemanları kullanılmayacak, yalnızca node_ids tarafından belirtilen indeksler kullanılacaktır.
splitTypes Bu Op'un özellik başına eşitsizlik bölmesi mi yoksa eşitlik bölmesi mi yapması gerektiğini gösteren Derece 1 tensörü.
adayÖzellik Kimlikleri Her özellik için kimlikleri olan 1. derece tensör. Bu, özelliğin gerçek kimliğidir.
l1 Örnek bazında yaprak ağırlıklarına ilişkin l1 düzenleme faktörü.
l2 Örnek bazında yaprak ağırlıklarına ilişkin l2 düzenleme faktörü.
ağaçKarmaşıklık yaprak bazında kazanç ayarı.
minNodeWeight Düğümün bölünme için dikkate alınması için gerekli olan düğümdeki minimum hessian ortalaması.
logitsBoyut Logit boyutu, yani sınıf sayısı.
İadeler
  • BoostedTreesCalculateBestFeatureSplitV2'nin yeni bir örneği

public Output <Integer> featureDimensions ()

Özelliğin çok boyutlu olması durumunda, her özelliğin belirli düğümler için bölünecek en iyi özellik boyutunu gösteren Derece 1 tensörler. Şekiller ve boyutlar gibi ayrıntılar için yukarıya bakın.

genel Çıkış <Tamsayı> featureIds ()

Her düğüm için en iyi özellik kimliğini gösteren Derece 1 tensörler. Şekiller ve boyutlar gibi ayrıntılar için yukarıya bakın.

public Çıkış <Float> kazançları ()

Belirli düğümlere bölünecek her özellik için en iyi kazanımları gösteren Derece 1 tensör. Şekiller ve boyutlar gibi ayrıntılar için yukarıya bakın.

public Çıktı <Float> leftNodeContribs ()

Her özellik için verilen eşiğe göre ana düğümlerden (çıkış node_ids_list'teki tensör öğesi tarafından verilir) sol yöne dallanırken sol düğümlerin katkısını gösteren Sıra 2 tensörler. Bu değer, üst düğüm değerine eklenerek sol düğüm değerini oluşturmak için kullanılacaktır. İkinci boyut boyutu, 1 boyutlu logitler için 1'dir, ancak çok sınıflı problemler için daha büyük olacaktır. Şekiller ve boyutlar gibi ayrıntılar için yukarıya bakın.

genel Çıkış <Tamsayı> nodeIds ()

Her özellik için olası bölünmüş düğüm kimliklerini gösteren Derece 1 tensörler. Listenin uzunluğu num_features'tır, ancak her özellik farklı olası düğümler sağladığından her tensörün farklı boyutu vardır. Şekiller ve boyutlar gibi ayrıntılar için yukarıya bakın.

public Çıkış <Float> rightNodeContribs ()

left_node_contribs_list ile aynı şekle/koşullara sahip, ancak yalnızca değerin sağ düğüm için olduğu Derece 2 tensörler.

public Output <String> splitWithDefaultDirections ()

Veri eksikse hangi yöne gidileceğini gösteren Derece 1 tensörler. Şekiller ve boyutlar gibi ayrıntılar için yukarıya bakın. Varsayılan sol ile eşitsizlik 0 değerini, varsayılan sağ ile eşitsizlik 1'i, varsayılan sağ ile eşitlik 2 değerini döndürür.

genel Çıkış <Tamsayı> eşikleri ()

Her düğümde bölme için karşılaştırılacak paket kimliğini (eşik olarak) belirten Derece 1 tensörler. Şekiller ve boyutlar gibi ayrıntılar için yukarıya bakın.