BoostedTreesCalculateBestFeatureSplit

genel final dersi BoostedTreesCalculateBestFeatureSplit

Her özellik için kazançları hesaplar ve özellik için mümkün olan en iyi bölünmüş bilgiyi döndürür.

Bölünmüş bilgiler, her özellik için en iyi eşik (paket kimliği), kazançlar ve düğüm başına sol/sağ düğüm katkılarıdır.

Her bir özelliğe göre tüm düğümlerin bölünememesi mümkündür. Bu nedenle olası düğümlerin listesi özellikler arasında farklılık gösterebilir. Bu nedenle, her özellik için, bu özelliğin bölmek için kullanılabileceği düğümlerin listesini içeren 'node_ids_list'i döndürürüz.

Bu şekilde, çıktı, özellik başına ve düğüm başına en iyi bölünmedir, böylece her düğüm için (olası tüm özellikler arasında) en iyi bölünmeyi üretmek için daha sonra birleştirilmesi gerekir.

Çıkış şekilleri, tüm tensörlerin ilk boyutu aynı olacak ve her özellik için olası bölünmüş düğümlerin sayısına eşit olacak şekilde uyumludur.

İç İçe Sınıflar

sınıf BoostedTreesEn İyi Özelliği HesaplaBöl.Seçenekler BoostedTreesCalculateBestFeatureSplit için isteğe bağlı özellikler

Genel Yöntemler

Statik GüçlendirilmişAğaçlarHesaplaEn İyiÖzellikBölme
create ( Kapsam kapsamı, İşlenen <Tamsayı> nodeIdRange, İşlenen <Float> statsSummary, İşlenen <Float> l1, İşlenen <Float> l2, İşlenen <Float> ağaç Karmaşıklığı, İşlenen <Float> minNodeWeight, Uzun logitsDimension, Seçenekler... seçenekler)
Yeni bir BoostedTreesCalculateBestFeatureSplit işlemini saran bir sınıf oluşturmaya yönelik fabrika yöntemi.
Çıkış <Tamsayı>
özellikBoyutlar ()
Özelliğin çok boyutlu olması durumunda, her özelliğin belirli düğümler için bölünecek en iyi özellik boyutunu gösteren Derece 1 tensörler.
Çıkış <Kamanma>
kazançlar ()
Belirli düğümlere bölünecek her özellik için en iyi kazanımları gösteren Derece 1 tensörler.
Çıkış <Kamanma>
leftNodeKatkılar ()
Her özellik için verilen eşiğe göre ana düğümlerden (çıkış node_ids_list'teki tensör öğesi tarafından verilir) sol yöne dallanırken sol düğümlerin katkısını gösteren Sıra 2 tensörler.
Çıkış <Tamsayı>
düğüm kimlikleri ()
Her özellik için olası bölünmüş düğüm kimliklerini gösteren Derece 1 tensörler.
Çıkış <Kamanma>
rightNodeKatkılar ()
left_node_contribs_list ile aynı şekle/koşullara sahip, ancak yalnızca değerin sağ düğüm için olduğu Derece 2 tensörler.
statik BoostedTreesCalculateBestFeatureSplit.Options
splitType (Dize splitType)
Çıkış <Dize>
splitWithDefaultDirections ()
Veri eksikse hangi yöne gidileceğini gösteren Derece 1 tensörler.
Çıkış <Tamsayı>
eşikler ()
Her düğümde bölme için karşılaştırılacak paket kimliğini (eşik olarak) belirten Derece 1 tensörler.

Kalıtsal Yöntemler

Genel Yöntemler

public static BoostedTreesCalculateBestFeatureSplit create ( Kapsam kapsamı, İşlenen <Tamsayı> nodeIdRange, İşlenen <Float> statsSummary, İşlenen <Float> l1, İşlenen <Float> l2, İşlenen <Float> ağaç Karmaşıklığı, İşlenen <Float> minNodeWeight, Long logitsDimension, Seçenekler.. . seçenekler)

Yeni bir BoostedTreesCalculateBestFeatureSplit işlemini saran bir sınıf oluşturmaya yönelik fabrika yöntemi.

Parametreler
kapsam mevcut kapsam
nodeIdRange 'stats_summary_list' içinde işlenecek düğüm kimliklerinin aralığını [ilk, son) belirtmek için Derece 1 tensörü (şekil=[2]). Düğümler, tensör tarafından belirtilen iki düğüm arasında, 'for node_id in range(node_id_range[0], node_id_range[1])' gibi yinelenir (Son indeks node_id_range[1]'in özel olduğunu unutmayın).
istatistikÖzet Her özellik için düğüm başına, boyut başına, paket başına birikmiş istatistik özeti (gradyan/hessian) için Derece 4 tensör (#shape=[max_splits, feature_dims, bundle, stats_dims]). Tensörün ilk boyutu maksimum bölme sayısıdır ve bu nedenle tüm öğeleri kullanılmayacak, yalnızca node_ids tarafından belirtilen indeksler kullanılacaktır.
l1 Örnek bazında yaprak ağırlıklarına ilişkin l1 düzenleme faktörü.
l2 Örnek bazında yaprak ağırlıklarına ilişkin l2 düzenleme faktörü.
ağaçKarmaşıklık yaprak bazında kazanç ayarı.
minNodeWeight Düğümün bölünme için dikkate alınması için gerekli olan düğümdeki minimum hessian ortalaması.
logitsBoyut Logit boyutu, yani sınıf sayısı.
seçenekler isteğe bağlı nitelik değerlerini taşır
İadeler
  • BoostedTreesCalculateBestFeatureSplit'in yeni bir örneği

public Output <Integer> featureDimensions ()

Özelliğin çok boyutlu olması durumunda, her özelliğin belirli düğümler için bölünecek en iyi özellik boyutunu gösteren Derece 1 tensörler. Şekiller ve boyutlar gibi ayrıntılar için yukarıya bakın.

public Çıkış <Float> kazançları ()

Belirli düğümlere bölünecek her özellik için en iyi kazanımları gösteren Derece 1 tensörler. Şekiller ve boyutlar gibi ayrıntılar için yukarıya bakın.

public Çıktı <Float> leftNodeContribs ()

Her özellik için verilen eşiğe göre ana düğümlerden (çıkış node_ids_list'teki tensör öğesi tarafından verilir) sol yöne dallanırken sol düğümlerin katkısını gösteren Sıra 2 tensörler. Bu değer, üst düğüm değerine eklenerek sol düğüm değerini oluşturmak için kullanılacaktır. İkinci boyut boyutu, 1 boyutlu logitler için 1'dir, ancak çok sınıflı problemler için daha büyük olacaktır. Şekiller ve boyutlar gibi ayrıntılar için yukarıya bakın.

genel Çıkış <Tamsayı> nodeIds ()

Her özellik için olası bölünmüş düğüm kimliklerini gösteren Derece 1 tensörler. Listenin uzunluğu num_features'tır, ancak her özellik farklı olası düğümler sağladığından her tensörün farklı boyutu vardır. Şekiller ve boyutlar gibi ayrıntılar için yukarıya bakın.

public Çıkış <Float> rightNodeContribs ()

left_node_contribs_list ile aynı şekle/koşullara sahip, ancak yalnızca değerin sağ düğüm için olduğu Derece 2 tensörler.

public static BoostedTreesCalculateBestFeatureSplit.Options splitType (Dize splitType)

Parametreler
splitType Bu Op'un eşitsizlik bölmesi mi yoksa eşitlik bölmesi mi yapması gerektiğini belirten bir dize.

public Output <String> splitWithDefaultDirections ()

Veri eksikse hangi yöne gidileceğini gösteren Derece 1 tensörler. Şekiller ve boyutlar gibi ayrıntılar için yukarıya bakın. Varsayılan sol ile eşitsizlik 0 değerini, varsayılan sağ ile eşitsizlik 1'i, varsayılan sağ ile eşitlik 2 değerini döndürür.

genel Çıkış <Tamsayı> eşikleri ()

Her düğümde bölme için karşılaştırılacak paket kimliğini (eşik olarak) belirten Derece 1 tensörler. Şekiller ve boyutlar gibi ayrıntılar için yukarıya bakın.