可为 R-Boosting 分类算法进行配置的属性。
实施该算法的 R 包有 adabag 和 rpart。
在此部件中,选择决策树方法作为分类方法。
当列名称包含连字符(-)时,请使用“数据类型”部件重新定义列名称。
| 属性 | 说明 |
|---|---|
| 最大深度 | 输入节点在最终树中的最高级别,其中根节点级别计为 0。此参数可以设置为 1 和 20 之间(包含 1 和 20)。 |
| 最小拆分 | 输入拆分节点所需的最小观测数。默认值为 0。此参数可以设置为 0 和 500 之间(包含 0 和 500)。 |
| 复杂度参数 | 输入可节省计算时间(通过阻止所有无法改善拟合的拆分)的复杂度参数。该参数值必须介于 [-1, 1) 之间,即等于或大于 -1 并小于 1。 |
| 迭代数 | 运行 Boosting 的迭代数。此参数可以设置为 5 和 500 之间(包含 5 和 500)。 |
| 样本权重 | 如果为真,则培训集的自举样本通过使用对该迭代的每个观测的权重绘出。如果为假,则按每个观测的权重使用它们。 |
| 权重更新系数 | 计算权重更新系数(在 AdaBoost.M1 算法中为 α)的三种方式如下:A)“Breiman”:α=1/[2 ln((1-err)/err)],以及 B)“Freund”:α=ln((1-err)/err),以及 C)“Zhu”:α=ln((1-err)/err)+ln(N_classes-1)。 |
| 功能 | 选择要对其执行分析的输入列。 |
| 目标列 | 选择要对其执行分析的目标列。 |