HANA R 随机森林分类
可为 HANA R 随机森林分类算法进行配置的属性。
概述:
随机森林是对分类和回归算法使用的常见集成方法。该算法通过在培训时构造决策集而执行。对于分类任务,输出类基于从森林中各个决策树进行的多数投票。与其他分类算法相比,此集成方法的业务数据集有更好的精确度和泛化。
实施该算法的 R 包是
randomForest
。
注意
每个数据集功能支持的最大级别为 53。
HANA R 随机森林分类属性
表 1: 算法属性
属性
说明
功能
选择要对其执行分析的输入列。
目标列
选择要对其执行分析的目标列。
要增长的树数
在随机森林中需要增长的树数。此参数可以设置为 5 和 1000 之间(包含 5 和 1000)。
最小终端节点数
决策树中的最小终端节点数。此参数可以设置为 10 和 500 之间(包含 10 和 500)。