HANA 自组织地图

可为 HANA 自组织地图算法进行配置的属性。

语法

自组织地图(SOM)或自组织特征地图 (SOFM) 是一种人工神经网络类型,使用无监督学习的培训方式生成一种培训示例的输入空间的离散式低维(维通常是二维)表示法,称为地图。自组织地图与其他人工神经网络不同,因为它们使用邻居函数,保留输入空间的拓扑属性。

这使 SOM 可用于可视化高维数据的低维视图,类似于多维标度法。将该模型首次描述为人工神经网络的是芬兰教授 Teuvo Kohonen,因此该模型有时也称为 Kohonen 地图。与多数人工神经网络类似,SOM 按以下两种模式运行:培训和映射。培训会使用输入示例构建映射。这是一种竞争过程,因此也称为矢量量化。映射会自动对新的输入矢量分类。

SOM 方法有多种应用,如虚拟化、web 文档聚类和语音识别。

HANA 自组织映射属性
表 1: 算法属性
属性 说明
地图高度 输入地图高度。默认值为 5。
地图宽度 输入地图宽度。默认值为 5。
Alpha 为学习速率输入值。默认值为 0.5。
地图形状 选择地图形状。
功能 选择希望用于执行分析的输入列。
计算轮廓 选择此选项可计算轮廓值。轮廓表示聚类的质量。轮廓值为 1 表示聚类的质量较好,为 0 表示聚类的质量较差。
簇名称 输入新列的名称,此新列包含给定数据集的簇数。
缺少值 选择处理缺少值的方法。
可能的方法:
  • 忽略:该算法会跳过独立列或从属列中包含缺少值的记录。
  • 保留:该算法保留计算期间包含缺少值的记录。
规范化类型 选择规范化的类型。
可能的类型:
  • 不需要规范化
  • 新范围规范化
  • “零得分”规范化
随机种子 输入希望用于执行计算的随机数。如果输入 -1,则算法自行选择一个随机数用于计算。 默认值为 -1。
最大迭代数 输入希望算法用于查找簇的迭代数。默认值为 100。
线程数 输入算法应在执行过程中使用的线程数。默认值为 2。