一旦获得分析的相关数据,用户需要应用合适的算法以决定数据的模式。
决定符合特定目的合适的算法有一定的难度。可以将一些算法组合起来使用以对数据进行分析。例如,可以首先使用时间序列算法平滑数据,然后使用回归算法查找趋势。
| 用途 | 算法 |
|---|---|
| 执行基于时间的预测 | 时间序列算法
|
| 根据数据集中的其他变量预测连续变量。 | 回归算法
|
| 查找大型事务数据集中频繁出现的项目集模式以生成关联规则。 | 关联算法
|
| 根据观测的相似性,将观测聚类为几组类似的项目集 | 聚类算法
|
| 根据数据集中的其他变量,将一个或更多的离散变量分类并做分析。 | 决策树
|
| 检测数据集中的异常值 | 异常值检测算法
|
| 预测、分类和统计模式识别 | 神经网络算法
|