可为 HANA R 先验算法进行配置的属性。
使用此算法可查找大型事务数据集中常用的项目集模式,使用“arules”R 包生成关联规则。 可利用此算法理解客户会倾向同时购买哪些产品和服务。 用户可通过关联分析来分析客户的购买趋势,从而可以预测客户将来的购买行为。
例如,购买鞋子的客户很有可能还会购买袜子,这一信息可以表示为一种关联规则(具有给定的最小支持和最小置信度):鞋子=> 袜子 [支持 = 0.5, 置信度 = 0.1]
| 属性 | 说明 |
|---|---|
| 输出模式 | 选择希望使用的算法输出模式。 |
| 输入格式 | 选择输入数据的格式。 |
| 项目列 | 选择您希望应用该算法的项目所在的列。 |
| 事务 ID 列 | 选择您希望应用该算法的事务 ID 所在的列。 |
| 支持 | 输入项目的最小支持值。 |
| 置信度 | 输入规则/关联的最小置信度值。 |
| 规则 | 输入新列的名称,此新列包含给定数据集的先验规则。 |
| 支持值 | 输入新列的名称,此新列包含对应规则的支持。 |
| 置信度值 | 输入新列的名称,此新列包含对应规则的置信度值。 |
| 提升值 | 输入新列的名称,此新列包含对应规则的提升值。 |
| 事务 ID | 输入新列的名称,此新列包含事务 ID。 |
| 条目 | 输入新列的名称,此新列包含项目的名称。 |
| 匹配规则 | 输入新列的名称,此新列包含匹配规则。 |
| Lhs 项目 | 输入逗号分隔的项目标签,这些项目显示在规则或项目集的左侧。 |
| Rhs 项目 | 输入逗号分隔的项目标签,这些项目显示在规则或项目集的右侧。 |
| 两项目均有 | 输入逗号分隔的项目标签,这些项目显示在规则或数据集的两边。 |
| 无任何项目 | 输入逗号分隔的项目标签,这些项目不需要显示在规则或数据集上。 |
| 默认外观 | 输入未显式提及的项目的默认外观。 |
| 排序类型 | 选择排序选项以根据项目的频率将其排序。 |
| 过滤器条件 | 输入数值,此数值表明如何过滤事务中未使用的项目。 默认值为 0.1。 |
| 使用树结构 | 要将事务组织为前缀树,请选择“真”。 |
| 使用堆排序 | 要使用堆排序而非快速排序对事务进行排序,请选择“真”。 |
| 优化内存 | 要最小化内存使用(而不是最大化速度),请选择“真”。 |
| 将事务加载到内存中 | 要将事务加载到内存,请选择“真”。 |