R-CNR 树

可为 R-CNR 树算法进行配置的属性。

语法 使用此算法可将观测分类成组,并根据其他变量预测一个或多个离散变量。但是,用户也可以使用此算法查找数据中的趋势。
注意
  • “rpart”包是 R 2.15 的一部分,不能处理名称中有空格或特殊字符的列。“rpart”包仅支持由 R 数据框架支持的输入列名称格式。
  • 在模型计分时使用的独立列名称应与创建模型时使用的独立列名称一致。
  • 不支持包含空格或其他任何特殊字符(句点 (.) 除外)的列名称。
R-CNR 树属性
表 1: 算法属性
属性 说明
输出模式 选择希望使用的算法输出模式。
可能的值:
  • 趋势:预测从属列的值,并添加一个包含预测值输出的额外列。
  • 填充:填充目标列中的缺少值。
功能 选择希望用于执行分析的输入列。
目标变量 选择希望用于执行分析的目标列。
缺少值 选择处理缺少值的方法。
可能的方法:
  • Rpart:该算法删除所有缺少从属列的观测。但是,算法保留缺少一个或朵儿独立列的观测。
  • 忽略:该算法会跳过独立列或从属列中包含缺少值的记录。
  • 保留:该算法保留计算期间包含缺少值的记录。
  • 停止:算法将停止执行(如果独立列或从属列中缺少一个值)。
算法类型 选择希望算法执行的分析类型。
可能的值:
  • 分类:使用此类型(如果从属变量含有类别值)。
  • 回归:使用此类型(如果从属变量含有数值)。
最小拆分 输入拆分节点所需的最小观测数。默认值为 10。
拆分条件 选择节点的拆分条件。
可能的值:
  • 基尼:基尼不纯度。
  • 信息:信息获取。
预测列的名称 为新创建的包含预测值的列输入名称。
复杂度参数 输入可节省计算时间(通过阻止所有无法改善拟合的拆分)的复杂度参数。默认值为 0.005。
最大深度 输入节点在最终树中的最高级别,其中根节点级别计为 0。
注意 如果最大深度大于 30,则算法不会产生预计的结果(在 32 位计算机上)。
交叉验证 输入交叉验证的数目。较高的交叉验证值会增加计算时间并产生更多准确结果。
先验概率 输入先验概率的矢量。
使用替代 选择在拆分过程中使用的替代。
可能的值:
  • 仅显示 - 针对主要拆分规则的含有缺少值的观测不会再往树的更深处发送。
  • 使用替代 - 使用此选项拆分缺少主要变量的主题;如果所有替代都缺失,将不会拆分观测。
  • 如果缺失,则停止 - 如果所有替代都缺失,该算法将把观测往多数方向发送。
替代样式 输入可控制最佳替代选择的样式。
可能的值:
  • 使用总体正确分类 - 算法使用正确分类的总数查找潜在的替代变量。
  • 使用非缺失用例的百分比 - 算法使用已分类的非缺失用例的百分比查找潜在替代。
最大替代数 输入最大替代数,该替代数保留在树中的每个节点上。
显示概率 选择“显示概率”复选框可在对分类模型计分期间,获得预测值的概率。