R-Boosting 分类

可为 R-Boosting 分类算法进行配置的属性。

概述:
Booting 算法是可用于分类的常见集成方法。在该部件中支持 Adaboost.M1Adaboost-SAMME 算法。集成算法被设计为可以提高业务数据集的弱限定元的精确度和稳定性。

实施该算法的 R 包有 adabagrpart

注意

在此部件中,选择决策树方法作为分类方法。

注意

当列名称包含连字符(-)时,请使用“数据类型”部件重新定义列名称。

R-Boosting 分类属性
表 1: 算法属性
属性 说明
最大深度 输入节点在最终树中的最高级别,其中根节点级别计为 0。此参数可以设置为 1 和 20 之间(包含 1 和 20)。
最小拆分 输入拆分节点所需的最小观测数。默认值为 0。此参数可以设置为 0 和 500 之间(包含 0 和 500)。
复杂度参数 输入可节省计算时间(通过阻止所有无法改善拟合的拆分)的复杂度参数。该参数值必须介于 [-1, 1) 之间,即等于或大于 -1 并小于 1。
迭代数 运行 Boosting 的迭代数。此参数可以设置为 5 和 500 之间(包含 5 和 500)。
样本权重 如果为真,则培训集的自举样本通过使用对该迭代的每个观测的权重绘出。如果为假,则按每个观测的权重使用它们。
权重更新系数 计算权重更新系数(在 AdaBoost.M1 算法中为 α)的三种方式如下:A)“Breiman”:α=1/[2 ln⁡((1-err)/err)],以及 B)“Freund”:α=ln⁡((1-err)/err),以及 ⁡ C)“Zhu”:α=ln⁡((1-err)/err)⁡+ln⁡(N_classes-1)。
功能 选择要对其执行分析的输入列。
目标列 选择要对其执行分析的目标列。