自動クラスタリング

HANA および HANA 以外のシナリオで自動クラスタリングアルゴリズムを設定できるプロパティです。

自動クラスタリングとは

自動クラスタリングアルゴリズムでは、ターゲット変数を参照するデータ内のセグメントを発見します。この処理は、最適なモデルを生成するためのクラスタリングアルゴリズムおよびキー入力変数を自動選択することによって実行されます。

ただし、自動クラスタリングは、ターゲット変数がなくても学習できます。1 つが提供されると、クラスタリングのパフォーマンスを検証し自動的にモデルを調整するために内部で使用されます。

注記 自動クラスタリングアルゴリズムを使用した分析の結果をチャート形式で表示して、確認できます。分析結果のサマリビューを表示することもできます。
構文 自動クラスタリングは、特定のビジネスクエスチョンに関連するセグメントを明らかにするために設計および最適化された、半教師あり/ターゲットクラスタリングアルゴリズムです。データセット内の自然なセグメントや共通する行動を検出し、各セグメントの説明を提供します。
注記 自動クラスタリングアルゴリズムを使用する場合、データセットの取得前に値をトリムすることをお奨めします。値のトリムオプションは "新しいデータセット" ダイアログの詳細オプションセクションにあります。

オンライン自動アルゴリズムで使用される関数の詳細については、次の場所で入手できる SAP Automated Predictive Library リファレンスガイド (APL) を参照してください。 http://help.sap.com/pa

HANA 自動クラスタリングプロパティ
表 1: アルゴリズムプロパティ
プロパティ 説明
機能 分析の実行で使用する入力列を選択します。
ターゲット変数 分析を実行するターゲット列 (オプション) を選択します。
最小クラスタ数 クラスタリングで使用するクラスタの最小数を入力します。
最大クラスタ数 クラスタリングで使用するクラスタの最大数を入力します。
予測列名 予測値が含まれる新規作成列の名前を入力します。