HANA 朴素贝叶斯

可为 HANA 朴素贝叶斯算法进行配置的属性。

语法

朴素贝叶斯是一种基于贝叶斯定理的分类算法。它通过假定特性有条件地彼此独立,以此估算类条件概率。尽管朴素贝叶斯很简单,但是它在诸如文档分类和垃圾邮件过滤方面的运用效果却很好,并且仅需少量的培训数据即可对分类所需的参数进行估算。

HANA 朴素贝叶斯属性
表 1: 算法属性
属性 说明
输出模式 选择希望使用的算法输出模式。
功能 选择希望用于执行分析的输入列。
目标变量 选择希望用于执行分析的目标列。
预测列的名称 为新创建的包含预测值的列输入名称。
拉普拉斯平滑 输入平滑观测的平滑常量。平滑常量必须是大于 0 的双精度值。输入 0 可禁用拉普拉斯平滑。
缺少值 选择处理缺少值的方法。
  • 忽略:该算法会跳过功能或目标变量中包含缺少值的记录。
  • 保留:该算法保留计算期间包含缺少值的记录。
线程数 输入算法应在执行过程中使用的线程数。默认值为 1。