R 随机森林回归

可为 R 随机森林回归算法进行配置的属性。

随机森林是对分类和回归算法使用的常见集成方法。该算法通过在培训时构造决策集而执行。对于回归任务,计算出各个树的平均预测作为输出。与其他回归算法相比,此集成方法的业务数据集有更好的精确度和泛化。

实施该算法的 R 包是 randomForest

注意

每个数据集功能支持的最大级别为 53。级别指的是变量可以可以取的值得类别、种类或类型,例如,列“性别”有两个级别“男”和“女”。在这种情况下,该变量的值不能超过 53 个类型。

R 随机森林回归属性
表 1: 算法属性
属性 说明
功能 选择要对其执行分析的输入列。
目标列 选择要对其执行分析的目标列。
要增长的树数 在随机森林中需要增长的树数。此参数可以设置为 5 和 1000 之间(包含 5 和 1000)。
最小终端节点数 决策树中的最小终端节点数。此参数可以设置为 10 和 500 之间(包含 10 和 500)。