BoostedTreesSparseCalculateBestFeatureSplit

کلاس نهایی عمومی BoostedTreesSparseCalculateBestFeatureSplit

سود هر ویژگی را محاسبه می کند و بهترین اطلاعات تقسیم ممکن را برای ویژگی برمی گرداند.

اطلاعات تقسیم بهترین آستانه (شناسه سطل)، سود و مشارکت گره چپ/راست در هر گره برای هر ویژگی است.

این امکان وجود دارد که نتوان همه گره ها را روی هر ویژگی تقسیم کرد. از این رو، لیست گره های ممکن می تواند بین ویژگی ها متفاوت باشد. بنابراین، "node_ids_list" را برای هر ویژگی، حاوی لیستی از گره‌هایی که این ویژگی می‌تواند برای تقسیم آنها استفاده شود، برمی‌گردانیم.

به این ترتیب، خروجی بهترین تقسیم برای هر ویژگی و هر گره است، به طوری که بعداً باید ترکیب شود تا بهترین تقسیم برای هر گره (در میان همه ویژگی‌های ممکن) ایجاد شود.

اشکال خروجی به گونه ای سازگار هستند که بعد اول همه تانسورها یکسان و برابر با تعداد گره های تقسیم ممکن برای هر ویژگی است.

کلاس های تو در تو

کلاس BoostedTreesSparseCalculateBestFeatureSplit.Options ویژگی های اختیاری برای BoostedTreesSparseCalculateBestFeatureSplit

روش های عمومی

Static BoostedTreesSparseCalculateBestFeatureSplit
ایجاد ( دامنه دامنه ، عملوند <Integer> nodeIdRange، عملوند <Integer> statsSummaryIndices، عملوند <Float> statsSummaryValues، عملوند <Integer> statsSummaryShape، عملوند <Float> l1، عملوند <Float> l1، عملوند <Float2, Operand >OperandCoFloat> > minNodeWeight، Long logitsDimension، Options... گزینه‌ها)
روش کارخانه برای ایجاد کلاسی که یک عملیات جدید BoostedTreesSparseCalculateBestFeatureSplit را بسته بندی می کند.
خروجی <عدد صحیح>
ابعاد ویژگی ()
یک تانسور رتبه 1 که بهترین بعد ویژگی را برای هر ویژگی برای تقسیم برای هر گره نشان می دهد.
خروجی <Float>
سود ()
یک تانسور رتبه 1 که بهترین سود را برای تقسیم هر گره نشان می دهد.
خروجی <Float>
leftNodeContribs ()
یک تانسور رتبه 2 که سهم گره های چپ را هنگام انشعاب از گره های والد به سمت چپ با آستانه مشخص برای هر ویژگی نشان می دهد.
خروجی <عدد صحیح>
nodeIds ()
یک تانسور رتبه 1 که شناسه گره های احتمالی قابل تقسیم را نشان می دهد.
خروجی <Float>
rightNodeContribs ()
یک تانسور رتبه 2، با شکل/شرایط مشابه left_node_contribs_list، اما این مقدار برای گره سمت راست است.
Static BoostedTreesSparseCalculateBestFeatureSplit.Options
splitType (رشته splitType)
خروجی <String>
splitWithDefaultDirections ()
یک تانسور رتبه 1 که نشان می دهد در صورت از دست دادن داده ها به کدام جهت بروید.
خروجی <عدد صحیح>
آستانه ()
یک تانسور رتبه 1 که نشان دهنده شناسه سطل برای مقایسه با (به عنوان آستانه) برای تقسیم در هر گره است.

روش های ارثی

روش های عمومی

عمومی static BoostedTreesSparseCalculateBestFeatureSplit ایجاد ( محدوده دامنه، عملوند <Integer> nodeIdRange، عملوند <Integer> statsSummaryIndices، عملوند <Float> statsSummaryValues، عملوند <Integer> statsFhapelondl>1، عملوند <Operand> statsF2>Summary ، عملوند <Float> treeComplexity، عملوند <Float> minNodeWeight، Long logitsDimension، Options... گزینه‌ها)

روش کارخانه برای ایجاد کلاسی که یک عملیات جدید BoostedTreesSparseCalculateBestFeatureSplit را بسته بندی می کند.

مولفه های
محدوده محدوده فعلی
nodeIdRange یک تانسور رتبه 1 (شکل=[2]) برای تعیین محدوده [اولین، آخرین) شناسه‌های گره برای پردازش در «stats_summary_list». گره ها بین دو گره مشخص شده توسط تانسور تکرار می شوند، مانند «برای node_id در محدوده (node_id_range[0]، node_id_range[1])» (توجه داشته باشید که آخرین فهرست node_id_range[1] انحصاری است).
آمار خلاصه شاخص ها یک تانسور رتبه 2 int64 با شکل متراکم [N، 4] (N تعداد مقادیر غیر صفر را مشخص می کند) برای خلاصه آمار انباشته شده (gradient/hessian) در هر گره در هر سطل برای هر ویژگی. بعد دوم شامل شناسه گره، بعد ویژگی، شناسه سطل و تیرگی آمار است. stats dim مجموع بعد لاجیت و بعد هسین است، بعد هسین می تواند در صورت استفاده از هسین مورب بعد لاجیت باشد یا اگر هسین کامل استفاده شود بعد 2 logits باشد.
statsSummaryValues یک تانسور شناور رتبه 1 با شکل متراکم [N] (N تعداد مقادیر غیر صفر را مشخص می‌کند)، که مقادیر هر عنصر را در خلاصه_شاخص‌ها ارائه می‌کند.
statsSummaryShape یک تانسور شناور رتبه 1 با شکل متراکم [4]، که شکل متراکم تانسور پراکنده را مشخص می‌کند، که [تعداد گره‌های درخت، ابعاد ویژگی، تعداد سطل‌ها، تیرگی آماری] است.
l1 l1 ضریب تنظیم بر وزن برگ، در هر نمونه بر اساس.
l2 l2 ضریب تنظیم بر وزن برگ، در هر نمونه بر اساس.
درخت پیچیدگی تعدیل با بهره، بر اساس هر برگ.
minNodeWeight حداقل میانگین هسین ها در یک گره قبل از نیاز به گره برای تقسیم شدن در نظر گرفته شود.
logitsDimension بعد لاجیت، یعنی تعداد کلاس ها.
گزینه ها مقادیر ویژگی های اختیاری را حمل می کند
برمی گرداند
  • یک نمونه جدید از BoostedTreesSparseCalculateBestFeatureSplit

خروجی عمومی <Integer> featureDimensions ()

یک تانسور رتبه 1 که بهترین بعد ویژگی را برای هر ویژگی برای تقسیم برای هر گره نشان می دهد.

دستاوردهای عمومی Output <Float> ()

یک تانسور رتبه 1 که بهترین سود را برای تقسیم هر گره نشان می دهد.

خروجی عمومی <Float> leftNodeContribs ()

یک تانسور رتبه 2 که سهم گره های چپ را هنگام انشعاب از گره های والد به سمت چپ با آستانه مشخص برای هر ویژگی نشان می دهد. این مقدار برای ایجاد مقدار گره چپ با افزودن به مقدار گره والد استفاده می شود. اندازه بعد دوم بعد لاجیت است.

خروجی عمومی <Integer> nodeIds ()

یک تانسور رتبه 1 که شناسه گره های احتمالی قابل تقسیم را نشان می دهد.

خروجی عمومی <Float> rightNodeContribs ()

یک تانسور رتبه 2، با شکل/شرایط مشابه left_node_contribs_list، اما این مقدار برای گره سمت راست است.

استاتیک عمومی BoostedTreesSparseCalculateBestFeatureSplit.Options splitType (String splitType)

مولفه های
splitType رشته ای که نشان می دهد این عملیات باید تقسیم نابرابری یا تقسیم برابری را انجام دهد.

خروجی عمومی <String> splitWithDefaultDirections ()

یک تانسور رتبه 1 که نشان می دهد در صورت از دست دادن داده ها به کدام جهت بروید. نابرابری با چپ پیش‌فرض 0، نابرابری با راست پیش‌فرض 1، برابری با راست پیش‌فرض 2 را برمی‌گرداند.

آستانه های خروجی عمومی <Integer> ()

یک تانسور رتبه 1 که نشان دهنده شناسه سطل برای مقایسه با (به عنوان آستانه) برای تقسیم در هر گره است.