配置 HANA 情绪分析部件

HANA 情绪分析部件允许用户分析一连串复杂的文本(如 Twitter 用户关于产品或服务的意见)。该部件分析各文本单元中的意见,并转述正面或负面情绪。通过这种方式,用户可将非结构化数据转换为一系列易于理解的类别,以发现影响因素。此时,用户可生成洞察力,以更好地运行业务。

先决条件
  • 服务器:配置使用 PAL、APL 和 R 的 HANA 系统(SPS 9+)。

  • 客户端:安装 Predictive Aalytics 2.4,并配置 R。

采取下列步骤分析情绪的一连串文本:

  1. 在 Expert Analytics 中,连接到“数据源”。例如,要分析 Twitter 用户关于产品或服务的意见,用户可使用名为 TwitterFeed 的表。
  2. “预测空间”中,从部件列表中选择“数据准备” - “预处理器” - “HANA 情绪分析”。将“HANA 情绪预测”部件拖放到分析编辑器。或者双击“HANA 情绪分析”部件。单击“确定”
  3. 双击“HANA 情绪分析”部件使用其配置设置。或者,在该部件上单击“设置” 图标,并从上下文菜单中,选择“配置设置”
  4. 在“HANA 情绪”对话框的“属性”面板中,从菜单中选择“目标变量”。注意变量将进行过滤,仅列示以下类型的文本列:TEXT、BINTEXT、VARCHAR、NCLOB、CLOB 或 BLOB。
  5. 添加“情绪列名称”,该名称为输出列名称。以 Twitter 为例,这是为各推文书写情绪的列名称。
  6. 在“高级”面板中,在“行为”部分采取以下操作:
    1. 选择分析文本的语言。在默认情况下,将分析所有支持语言,但可通过指定数据集所包含的语言进行优化。
    2. 选择 MIME 类型,以选择目标变量所包含文本的类型。在默认情况下,将分析所有支持的 MIME 类型,但可通过指定数据集所包含的 MIME 类型进行优化。
    3. 选择是否通过“启用不敬言语”复选框报告分析中不敬言语的数量。
    4. 映射有意用于分析的情绪。在相同部分中,命名用于分析和报告的情绪。以 Twitter 为例,各情绪可映射为“好”“坏”。通过这种方式,用户可处理两类问题。单击“完成”
  7. 用户可在配置时将情绪用于分析。例如,分析可通过从部件列表面板的算法部分添加到分析链中的决策树完成。
    注意

    分析可显示在可见支持工具中,如决策树。

  8. 单击“运行分析” 图标。完成分析需时间,因为在执行过程中创建了完整文本索引,该索引根据标记化及分析文本数延长执行时间。
  9. 单击“结果”选项卡以查看结果概要。
概要包括总输入记录、含情绪的记录、不含情绪的记录以及映射情绪的明细。以 Twitter 为例,概要包括好情绪和坏情绪的百分比以及唯一标记的数量。
现在可以配置 HANA 情绪分析部件并将其用作复杂分析中的预处理步骤。