HANA K-Means (K 平均)

HANA K-Means アルゴリズム用に設定できるプロパティです。

構文 このアルゴリズムを使用すれば、関係の予備知識がなくても、監視を関連する監視のグループにクラスタリングできます。このアルゴリズムでは、監視が k 個のグループにクラスタリングされます (k は入力パラメータとして指定します)。このアルゴリズムでは、クラスタの平均に対する監視の近接性に基づいて、各監視がクラスタに割り当てられます。クラスタが収束するまで処理は継続されます。
注記
  • 各クラスタのクラスタ数は、HANA K-Means (K 平均) アルゴリズムを実行するたびに変わる可能性があります。ただし、各クラスタ内の監視は同じになります。
  • HANA K-Means (K 平均) アルゴリズムを使用したモデルの作成はサポートされていません。
HANA K-Means (K 平均) のプロパティ
表 1: アルゴリズムプロパティ
プロパティ 説明
出力モード このアルゴリズムの出力を使用するモードを選択します。
機能 分析の実行で使用する入力列を選択します。
カテゴリ列 カテゴリ列として考慮する入力列を選択します。
分類加重 分類加重を入力します。
シルエットの計算 このオプションを選択して、シルエット値を計算します。シルエットはクラスタリングの品質を示します。シルエット値 1 はクラスタリングが良好であることを示し、0 は悪いことを示します。
欠落値 欠落値の処理方法を選択します。
指定できる方法:
  • 無視: 非依存列または依存列に欠落値のあるレコードがアルゴリズムでスキップされます。
  • 保持: 計算中は欠落値のあるレコードがアルゴリズムで保持されます。
クラスタ数 クラスタリングのグループ数を入力します。デフォルト値は 5 です。
クラスタ名 新規作成されるクラスタを含む列の名前を入力します。
距離 クラスタとその中心の距離を含む新規作成される列の名前を入力します。
最大反復数 クラスタの検出で許可される反復数を入力します。デフォルト値は 100 です。
中心計算方法 初期クラスタセンタを計算するために使用される方法を選択します。
距離メジャー アイテムとクラスタの中央との距離を計算する方法を入力します。
正規化タイプ 正規化のタイプを選択します。
スレッド数 実行に使用できるスレッド数を入力します。デフォルト値は 1 です。
終了しきい値 反復を終了するしきい値を入力します。デフォルト値は 0.000000001 です。