HANA R 自举聚合分类

可为 HANA R 自举聚合分类算法进行配置的属性。

概述:
自举聚合算法是可以应用于分类任务的常见集成方法。该算法创建原始数据集的随机子集并对每个子集执行分类。分类后的预测值将聚合以形成最终预测。此集成算法被设计为可以提高业务数据集的单一分类算法的精确度和稳定性。

实施该算法的 R 包有 adabagrpart

注意

在此部件中,选择决策树方法作为分类方法。

注意

当列名称包含连字符(-)时,请使用“数据类型”部件重新定义列名称。

HANA R 自举聚合分类属性
表 1: 算法属性
属性 说明
最大深度 输入节点在最终树中的最高级别,其中根节点级别计为 0。此参数可以设置为 1 和 20 之间(包含 1 和 20)。
最小拆分 输入拆分节点所需的最小观测值数。默认值为 0。此参数可以设置为 0 和 500 之间(包含 0 和 500)。
复杂度参数 输入可节省计算时间(通过阻止所有无法改善拟合的拆分)的复杂度参数。该参数值必须介于 [-1, 1) 之间,即等于或大于 -1 并小于 1。
要使用的树数 在决策树算法的森林中使用的树数。决策树算法用于自举聚合。此参数可以设置为 5 和 500 之间(包含 5 和 500)。
功能 选择要对其执行分析的输入列。
目标列 选择要对其执行分析的目标列。