HANA 自己組織化マップ

HANA Self-Organizing Maps アルゴリズム用に設定できるプロパティです。

構文

自己組織化マップ (SOM または SOFM) は、トレーニングサンプルの入力空間を低次元 (通常は 2 次元) で離散化して表したマップを生成するため、管理されない学習を使用してトレーニングされる人工ニューラルネットワークのタイプです。自己組織化マップは、入力空間のトポロジープロパティを保持するために近傍関数を使用する点で、他の人工ニューラルネットワークとは異なります。

これにより、SOM が多次元スケーリングと同種の高次元データの低次元ビューの視覚化の際に有用になります。このモデルは、最初にフィンランド人教授である Teuvo Kohonen 氏によって人工ニューラルネットワークとして説明され、コホネンマップと呼ばれることもあります。多くの人工ニューラルネットワークと同様に、SOM にもトレーニングとマッピングという 2 つのモードがあります。トレーニングでは、入力サンプルを使用してマップを構築します。これは、ベクトル量子化とも呼ばれる競合プロセスです。マッピングでは、新規入力ベクトルが自動的に分類されます。

SOM アプローチは、仮想化、Web ドキュメントクラスタリング、音声認識など、数多くの形で応用されています。

HANA 自己組織化マッププロパティ
表 1: アルゴリズムプロパティ
プロパティ 説明
マップ高さ マップの高さを入力します。デフォルト値は 5 です。
マップの幅 マップの幅を入力します。デフォルト値は 5 です。
アルファ 学習率の値を入力します。デフォルト値は 0.5 です。
マップの形 マップの形を選択します。
機能 分析の実行で使用する入力列を選択します。
シルエットの計算 このオプションを選択して、シルエット値を計算します。シルエットはクラスタリングの品質を示します。シルエット値 1 はクラスタリングが良好であることを示し、0 は悪いことを示します。
クラスタ名 指定したデータセットのクラスタ番号を含む新しい列の名前を入力します。
欠落値 欠落値の処理方法を選択します。
指定できる方法:
  • 無視: 非依存列または依存列に欠落値のあるレコードがアルゴリズムでスキップされます。
  • 保持: 計算中は欠落値のあるレコードがアルゴリズムで保持されます。
正規化タイプ 正規化のタイプを選択します。
指定できるタイプ:
  • 正規化は必要ありません
  • 新しい範囲の正規化
  • ゼロスコア正規化
ランダムシート 計算の実行に使用する乱数を入力します。-1 を入力すると、アルゴリズム自体で計算の乱数が選択されます。デフォルト値は -1 です。
最大反復数 クラスタ検出においてアルゴリズムで使用する反復数を入力します。デフォルト値は 100 です。
スレッド数 実行時にアルゴリズムが使用するスレッドの数を入力します。デフォルト値は 2 です。