حساب المكاسب لكل ميزة وإرجاع أفضل معلومات التقسيم الممكنة لكل عقدة. ومع ذلك، إذا لم يتم العثور على أي انقسام، فلن يتم إرجاع أي معلومات انقسام لتلك العقدة.
المعلومات المقسمة هي أفضل عتبة (معرف المجموعة) والمكاسب ومساهمات العقدة اليسرى/اليمنى لكل عقدة لكل ميزة.
من الممكن أنه لا يمكن تقسيم جميع العقد على كل ميزة. وبالتالي، يمكن أن تختلف قائمة العقد المحتملة بين الميزات. لذلك، نعيد "node_ids_list" لكل ميزة، والتي تحتوي على قائمة العقد التي يمكن استخدام هذه الميزة لتقسيمها.
بهذه الطريقة، يكون الإخراج هو أفضل تقسيم لكل ميزة ولكل عقدة، بحيث يجب دمجها لاحقًا لإنتاج أفضل تقسيم لكل عقدة (من بين جميع الميزات الممكنة).
تتوافق أشكال المخرجات بطريقة تجعل البعد الأول لجميع الموترات متماثلًا ويساوي عدد العقد المنقسمة المحتملة لكل ميزة.
الأساليب العامة
static BoostedTreesCalculateBestFeatureSplitV2 | إنشاء (نطاق النطاق ، المعامل <Integer> عقدة IdRange، Iterable < المعامل <Float>> statsSummariesList، المعامل <String> SplitTypes، المعامل <Integer> المرشح FeatureIds، المعامل <Float> l1، المعامل <Float> l2، المعامل <Float> تعقيد الشجرة، المعامل <Float> minNodeWeight، Long logitsDimension) طريقة المصنع لإنشاء فئة تلتف حول عملية BoostedTreesCalculateBestFeatureSplitV2 جديدة. |
الإخراج <عدد صحيح> | أبعاد الميزة () تشير موترات المرتبة الأولى إلى أفضل بُعد للميزة لكل ميزة لتقسيمها إلى عقد معينة إذا كانت الميزة متعددة الأبعاد. |
الإخراج <عدد صحيح> | معرفات الميزات () تشير موترات المرتبة الأولى إلى أفضل معرف ميزة لكل عقدة. |
الإخراج <تعويم> | المكاسب () موتر من المرتبة الأولى يشير إلى أفضل المكاسب لكل ميزة لتقسيمها إلى عقد معينة. |
الإخراج <تعويم> | leftNodeContribs () تشير موترات الرتبة 2 إلى مساهمة العقد اليسرى عند التفرع من العقد الأصلية (المقدمة بواسطة عنصر الموتر في قائمة مخرجات العقدة_ids_list) إلى الاتجاه الأيسر بواسطة العتبة المحددة لكل ميزة. |
الإخراج <عدد صحيح> | معرفات العقدة () تشير موترات الرتبة الأولى إلى معرفات العقدة المنقسمة المحتملة لكل ميزة. |
الإخراج <تعويم> | RightNodeContribs () موتر من المرتبة الثانية، بنفس الشكل/الشروط مثل left_node_contribs_list، ولكن القيمة فقط للعقدة اليمنى. |
الإخراج <سلسلة> | سبليت ويذديفولتديركشنز () تشير الموترات من المرتبة الأولى إلى الاتجاه الذي يجب اتباعه في حالة فقدان البيانات. |
الإخراج <عدد صحيح> | الحدود القصوى () تشير موترات الرتبة الأولى إلى معرف المجموعة المراد مقارنتها (كعتبة) للتقسيم في كل عقدة. |
الطرق الموروثة
الأساليب العامة
إنشاء BoostedTreesCalculateBestFeatureSplitV2 الثابت العام ( نطاق النطاق ، المعامل <Integer> عقدة IdRange، Iterable < المعامل <Float>> statsSummariesList، المعامل <String> SplitTypes، المعامل <Integer> المرشح FeatureIds، المعامل <Float> l1، المعامل <Float> l2، المعامل <Float > تعقيد الشجرة، المعامل <Float> minNodeWeight، Long logitsDimension)
طريقة المصنع لإنشاء فئة تلتف حول عملية BoostedTreesCalculateBestFeatureSplitV2 جديدة.
حدود
نِطَاق | النطاق الحالي |
---|---|
NodeIdRange | موتر من المرتبة الأولى (الشكل=[2]) لتحديد النطاق [الأول والأخير) لمعرفات العقدة المراد معالجتها ضمن "stats_summary_list". يتم تكرار العقد بين العقدتين المحددتين بواسطة الموتر، كما هو الحال `fornode_id in range(node_id_range[0],node_id_range[1])` (لاحظ أن الفهرس الأخيرNode_id_range[1] حصري). |
قائمة ملخصات الإحصائيات | قائمة الموتر من المرتبة 4 (#shape=[max_splits, feature_dims, Bucket, stats_dims]) لملخص الإحصائيات المتراكمة (التدرج/الهيسي) لكل عقدة، لكل بُعد، لكل مجموعة لكل ميزة. البعد الأول للموتر هو الحد الأقصى لعدد الانقسامات، وبالتالي لن يتم استخدام جميع عناصره، ولكن سيتم استخدام الفهارس المحددة بواسطةNode_ids فقط. |
SplitTypes | موتر من المرتبة الأولى يشير إلى ما إذا كان يجب على هذه العملية تنفيذ تقسيم عدم المساواة أو تقسيم المساواة لكل ميزة. |
معرفات ميزات المرشح | رتبة موتر 1 مع معرفات لكل ميزة. هذا هو المعرف الحقيقي للميزة. |
l1 | عامل التنظيم l1 على أوزان الأوراق، على أساس كل مثيل. |
l2 | عامل التنظيم l2 على أوزان الأوراق، على أساس كل مثيل. |
TreeComplexity | تعديل الكسب، على أساس كل ورقة. |
minNodeWeight | الحد الأدنى لمتوسط عدد الهسه في العقدة قبل أن يكون مطلوبًا حتى يتم أخذ العقدة بعين الاعتبار للتقسيم. |
logitsDimension | البعد اللوغاريتمي، أي عدد الفئات. |
عائدات
- مثيل جديد لـ BoostedTreesCalculateBestFeatureSplitV2
الإخراج العام <عدد صحيح> featureDimensions ()
تشير موترات المرتبة الأولى إلى أفضل بُعد للميزة لكل ميزة لتقسيمها إلى عقد معينة إذا كانت الميزة متعددة الأبعاد. انظر أعلاه للحصول على تفاصيل مثل الأشكال والأحجام.
الإخراج العام <عدد صحيح> معرفات الميزات ()
تشير موترات المرتبة الأولى إلى أفضل معرف ميزة لكل عقدة. انظر أعلاه للحصول على تفاصيل مثل الأشكال والأحجام.
مكاسب الإخراج العام <Float> ()
موتر من المرتبة الأولى يشير إلى أفضل المكاسب لكل ميزة لتقسيمها إلى عقد معينة. انظر أعلاه للحصول على تفاصيل مثل الأشكال والأحجام.
الإخراج العام <Float> leftNodeContribs ()
تشير موترات الرتبة 2 إلى مساهمة العقد اليسرى عند التفرع من العقد الأصلية (المقدمة بواسطة عنصر الموتر في قائمة مخرجات العقدة_ids_list) إلى الاتجاه الأيسر بواسطة العتبة المحددة لكل ميزة. سيتم استخدام هذه القيمة لإنشاء قيمة العقدة اليسرى عن طريق إضافتها إلى قيمة العقدة الأصلية. حجم البعد الثاني هو 1 للسجلات أحادية البعد، ولكنه سيكون أكبر للمشكلات متعددة الفئات. انظر أعلاه للحصول على تفاصيل مثل الأشكال والأحجام.
معرفات الإخراج العامة < عدد صحيح > ()
تشير موترات الرتبة الأولى إلى معرفات العقدة المنقسمة المحتملة لكل ميزة. طول القائمة هو num_features، لكن كل موتر له حجم مختلف حيث توفر كل ميزة عقدًا محتملة مختلفة. انظر أعلاه للحصول على تفاصيل مثل الأشكال والأحجام.
الإخراج العام <Float> rightNodeContribs ()
موتر من المرتبة الثانية، بنفس الشكل/الشروط مثل left_node_contribs_list، ولكن القيمة فقط للعقدة اليمنى.
الإخراج العام <String> SplitWithDefaultDirections ()
تشير الموترات من المرتبة الأولى إلى الاتجاه الذي يجب اتباعه في حالة فقدان البيانات. انظر أعلاه للحصول على تفاصيل مثل الأشكال والأحجام. عدم المساواة مع عائدات اليسار الافتراضية 0، عدم المساواة مع عائدات اليمين الافتراضية 1، المساواة مع عائدات اليمين الافتراضية 2.
عتبات الإخراج العام <عدد صحيح> ()
تشير موترات الرتبة الأولى إلى معرف المجموعة المراد مقارنتها (كعتبة) للتقسيم في كل عقدة. انظر أعلاه للحصول على تفاصيل مثل الأشكال والأحجام.