HANA CHAID

可为 HANA CHAID 算法进行配置的属性。

语法 CHAID 表示卡方自动交互检测(CHi-squared Automatic Interaction Detection)。CHAID 是一种构建决策树的分类方法,它使用卡方统计信息识别最佳拆分。
注意 在模型计分过程中使用的列的数据类型应与构建模型时使用的列的数据类型一致。
HANA CHAID 属性
表 1: 算法属性
属性 说明
输出模式 选择希望使用的算法输出模式。
可能的值:
  • 趋势:预测从属列的值,并添加一个包含预测值输出的额外列。
  • 填充:填充目标列中的缺少值。
功能 选择希望用于执行分析的输入列。
目标变量 选择希望用于执行分析的目标列。
注意 该属性仅接受数据类型是整数的列。
缺少值 选择处理缺少值的方法。
可能的值:
  • 忽略:该算法会跳过独立列或从属列中包含缺少值的记录。
  • 保留:该算法保留计算期间包含缺少值的记录。
输入数据的百分比 输入考虑对其进行分析的数据的百分比。
最小拆分 输入节点的最小记录数,该特定节点的拆分不允许超出此记录数。默认值为 0。
最大深度 输入树的最大深度。
列名称 选择包含数值的独立列的名称。
输入箱范围 输入箱范围。
预测列的名称 输入包含预测值的新列的名称。
线程数 输入算法应在执行过程中使用的线程数。