应用算法

一旦获得分析的相关数据,用户需要应用合适的算法以决定数据的模式。

决定符合特定目的合适的算法有一定的难度。可以将一些算法组合起来使用以对数据进行分析。例如,可以首先使用时间序列算法平滑数据,然后使用回归算法查找趋势。

针对特定目的选择何种算法,以下表格提供了这些信息:
用途 算法
执行基于时间的预测 时间序列算法
  • 单指数平滑
  • 双指数平滑
  • 三次指数平滑
根据数据集中的其他变量预测连续变量。 回归算法
  • 线性回归
  • 指数回归
  • 几何回归
  • 对数回归
  • 多元线性回归
  • 多项式回归
  • 逻辑回归
查找大型事务数据集中频繁出现的项目集模式以生成关联规则。 关联算法
  • 先验
  • AprioriLite
根据观测的相似性,将观测聚类为几组类似的项目集 聚类算法
  • K-Means
根据数据集中的其他变量,将一个或更多的离散变量分类并做分析。 决策树
  • HANA C 4.5
  • R-CNR 树
  • CHAID
检测数据集中的异常值 异常值检测算法
  • 四分位间距
  • 最近邻居异常值
  • 异常检测
  • 方差测试
预测、分类和统计模式识别 神经网络算法
  • R-NNet 神经网络
  • R-MONMLP 神经网络
如果未找到相关算法,可使用 Expert Analytics 中的 R 脚本创建自己的自定义部件,然后对获取的数据执行分析。有关添加自定义部件的更多信息,请参阅: 使用 R 部件创建向导指定属性
  1. “预测”空间中,双击右侧部件列表下所需的算法部件。
    算法部件将添加到分析编辑器并连接到分析中的先前部件。
  2. 从算法部件的上下文菜单中选择“配置属性”
  3. 在部件属性对话框中,输入算法部件属性的必要详细信息。
  4. 选择“完成”
  5. 要查看分析的结果,请选择 (运行分析)。