HANA R 先验

可为 HANA R 先验算法进行配置的属性。

语法

使用此算法可查找大型事务数据集中常用的项目集模式,使用“arules”R 包生成关联规则。 可利用此算法理解客户会倾向同时购买哪些产品和服务。 用户可通过关联分析来分析客户的购买趋势,从而可以预测客户将来的购买行为。

例如,购买鞋子的客户很有可能还会购买袜子,这一信息可以表示为一种关联规则(具有给定的最小支持和最小置信度):鞋子=> 袜子 [支持 = 0.5, 置信度 = 0.1]

HANA R 先验属性
表 1: 算法属性
属性 说明
输出模式 选择希望使用的算法输出模式。
输入格式 选择输入数据的格式。
项目列 选择您希望应用该算法的项目所在的列。
事务 ID 列 选择您希望应用该算法的事务 ID 所在的列。
支持 输入项目的最小支持值。
置信度 输入规则/关联的最小置信度值。
规则 输入新列的名称,此新列包含给定数据集的先验规则。
支持值 输入新列的名称,此新列包含对应规则的支持。
置信度值 输入新列的名称,此新列包含对应规则的置信度值。
提升值 输入新列的名称,此新列包含对应规则的提升值。
事务 ID 输入新列的名称,此新列包含事务 ID。
条目 输入新列的名称,此新列包含项目的名称。
匹配规则 输入新列的名称,此新列包含匹配规则。
Lhs 项目 输入逗号分隔的项目标签,这些项目显示在规则或项目集的左侧。
Rhs 项目 输入逗号分隔的项目标签,这些项目显示在规则或项目集的右侧。
两项目均有 输入逗号分隔的项目标签,这些项目显示在规则或数据集的两边。
无任何项目 输入逗号分隔的项目标签,这些项目不需要显示在规则或数据集上。
默认外观 输入未显式提及的项目的默认外观。
排序类型 选择排序选项以根据项目的频率将其排序。
过滤器条件 输入数值,此数值表明如何过滤事务中未使用的项目。 默认值为 0.1。
使用树结构 要将事务组织为前缀树,请选择“真”。
使用堆排序 要使用堆排序而非快速排序对事务进行排序,请选择“真”。
优化内存 要最小化内存使用(而不是最大化速度),请选择“真”。
将事务加载到内存中 要将事务加载到内存,请选择“真”。