BoostedTreesCalculateBestFeatureSplit

כיתת גמר ציבורית BoostedTreesCalculateBestFeatureSplit

מחשב רווחים עבור כל תכונה ומחזיר את המידע המפוצל הטוב ביותר עבור התכונה.

המידע המפוצל הוא הסף הטוב ביותר (מזהה דלי), רווחים ותרומת צומת שמאל/ימין לכל צומת עבור כל תכונה.

ייתכן שלא ניתן לפצל את כל הצמתים בכל תכונה. לפיכך, רשימת הצמתים האפשריים יכולה להיות שונה בין התכונות. לכן, אנו מחזירים `node_ids_list` עבור כל תכונה, המכילה את רשימת הצמתים שניתן להשתמש בתכונה זו לפיצול.

באופן זה, הפלט הוא הפיצול הטוב ביותר לכל תכונות ולכל צומת, כך שצריך לשלב אותו מאוחר יותר כדי לייצר את הפיצול הטוב ביותר עבור כל צומת (בין כל התכונות האפשריות).

צורות הפלט תואמות באופן שהמימד הראשון של כל הטנזורים זהה ושווה למספר הצמתים המפוצלים האפשריים עבור כל תכונה.

כיתות מקוננות

מעמד BoostedTreesCalculateBestFeatureSplit.Options תכונות אופציונליות עבור BoostedTreesCalculateBestFeatureSplit

שיטות ציבוריות

סטטי BoostedTreesCalculateBestFeatureSplit
create ( scope scope, Operand <Integer> nodeIdRange, Operand <Float> statsSummary, Operand <Float> l1, Operand <Float> l2, Operand <Float> treeComplexity, Operand <Float> minNodeWeight, Long logitsDimension, Options... options)
שיטת מפעל ליצירת מחלקה העוטפת פעולת BoostedTreesCalculateBestFeatureSplit חדשה.
פלט <מספר שלם>
featureDimensions ()
טנסור דירוג 1 המציין את ממד התכונה הטוב ביותר עבור כל תכונה לפיצול עבור צמתים מסוימים אם התכונה היא רב-ממדית.
פלט <צף>
רווחים ()
טנסור דרגה 1 המציין את הרווחים הטובים ביותר עבור כל תכונה לפיצול עבור צמתים מסוימים.
פלט <צף>
leftNodeContribs ()
טנסור דירוג 2 המציין את תרומתם של הצמתים השמאליים בעת הסתעפות מצמתי אב (ניתן על ידי אלמנט הטנזור ב-out node_ids_list) לכיוון שמאל לפי הסף הנתון עבור כל תכונה.
פלט <מספר שלם>
nodeIds ()
טנסור דרגה 1 המציין מזהי צומת מפוצלים אפשריים עבור כל תכונה.
פלט <צף>
rightNodeContribs ()
טנסור דרגה 2, עם אותם צורה/תנאים כמו left_node_contribs_list, אבל רק שהערך הוא עבור הצומת הימני.
סטטי BoostedTreesCalculateBestFeatureSplit.Options
splitType (String splitType)
פלט <מחרוזת>
splitWithDefaultDirections ()
טנסור דרגה 1 המציין לאיזה כיוון ללכת אם חסרים נתונים.
פלט <מספר שלם>
ספים ()
טנסור דרגה 1 המציין את מזהה הדלי שיש להשוות איתו (כסף) לפיצול בכל צומת.

שיטות בירושה

שיטות ציבוריות

public static BoostedTreesCalculateBestFeatureSplit create ( scope scope, Operand <Integer> nodeIdRange, Operand <Float> statsSummary, Operand <Float> l1, Operand <Float> l2, Operand <Float> treeComplexity, Operand <Float> minNodeWeight, logits. . אפשרויות)

שיטת מפעל ליצירת מחלקה העוטפת פעולת BoostedTreesCalculateBestFeatureSplit חדשה.

פרמטרים
תְחוּם ההיקף הנוכחי
nodeIdRange טנסור דירוג 1 (צורה=[2]) כדי לציין את הטווח [ראשון, אחרון) של מזהי צומת לעיבוד בתוך `stats_summary_list`. הצמתים עוברים איטרציה בין שני הצמתים שצוינו על ידי הטנזור, כמו `for node_id in range(node_id_range[0], node_id_range[1])` (שים לב שהאינדקס האחרון node_id_range[1] הוא בלעדי).
סטטיסטיקה סיכום טנזור דירוג 4 (#shape=[max_splits, feature_dims, bucket, stats_dims]) לסיכום נתונים סטטיסטיים מצטברים (שיפוע/הסיאן) לכל צומת, לכל מימד, לכל דליים עבור כל תכונה. המימד הראשון של הטנזור הוא המספר המרבי של פיצולים, ולכן לא כל האלמנטים שלו ישמשו, אלא רק האינדקסים שצוינו על ידי node_ids ישמשו.
l1 גורם רגוליזציה l1 על משקלי עלים, לפי מופע.
l2 גורם רגוליזציה l2 על משקלי עלים, לפי מופע.
מורכבות עץ התאמה לרווח, לפי עלה.
minNodeWeight הממוצע המינימלי של הסינים בצומת נדרש לפני שהצומת ייחשב לפיצול.
logitsDimension הממד של logit, כלומר, מספר המחלקות.
אפשרויות נושא ערכי תכונות אופציונליות
החזרות
  • מופע חדש של BoostedTreesCalculateBestFeatureSplit

פלט ציבורי <Integer> featureDimensions ()

טנסור דירוג 1 המציין את ממד התכונה הטוב ביותר עבור כל תכונה לפיצול עבור צמתים מסוימים אם התכונה היא רב-ממדית. ראה למעלה לפרטים כמו צורות וגדלים.

רווחי פלט ציבורי <Float> ()

טנסור דרגה 1 המציין את הרווחים הטובים ביותר עבור כל תכונה לפיצול עבור צמתים מסוימים. ראה למעלה לפרטים כמו צורות וגדלים.

פלט ציבורי <Float> leftNodeContribs ()

טנסור דירוג 2 המציין את תרומתם של הצמתים השמאליים בעת הסתעפות מצמתי אב (ניתן על ידי אלמנט הטנזור ב-out node_ids_list) לכיוון שמאל לפי הסף הנתון עבור כל תכונה. ערך זה ישמש ליצירת ערך הצומת השמאלי על ידי הוספה לערך הצומת האב. גודל הממד השני הוא 1 עבור לוגיטים חד-ממדיים, אך יהיה גדול יותר עבור בעיות מרובות מחלקות. ראה למעלה לפרטים כמו צורות וגדלים.

NodeIds של פלט ציבורי <Integer> ()

טנסור דרגה 1 המציין מזהי צומת מפוצלים אפשריים עבור כל תכונה. אורך הרשימה הוא num_features, אך לכל טנזור יש גודל שונה מכיוון שכל תכונה מספקת צמתים אפשריים שונים. ראה למעלה לפרטים כמו צורות וגדלים.

פלט ציבורי <Float> rightNodeContribs ()

טנסור דרגה 2, עם אותם צורה/תנאים כמו left_node_contribs_list, אבל רק שהערך הוא עבור הצומת הימני.

public static BoostedTreesCalculateBestFeatureSplit.Options splitType (String splitType)

פרמטרים
splitType מחרוזת המציינת אם ה-Op הזה צריך לבצע פיצול אי-שוויון או פיצול שוויון.

פלט ציבורי <String> splitWithDefaultDirections ()

טנסור דרגה 1 המציין לאיזה כיוון ללכת אם חסרים נתונים. ראה למעלה לפרטים כמו צורות וגדלים. אי שוויון עם ברירת מחדל שמאל מחזיר 0, אי שוויון עם ברירת מחדל ימין מחזיר 1, שוויון עם ברירת מחדל ימין מחזיר 2.

ספי <Integer> פלט ציבורי ()

טנסור דרגה 1 המציין את מזהה הדלי שיש להשוות איתו (כסף) לפיצול בכל צומת. ראה למעלה לפרטים כמו צורות וגדלים.