モデル比較コンポーネントを使用して、すべてのシナリオ (SAP HANA およびその他) で複雑な問題を解決するために、2 つのアルゴリズムからパフォーマンスが適切な方を特定します。詳細な分析を実行する子コンポーネントを追加します。
前提条件:モデル比較チェーンを作成するには、
モデル比較コンポーネントとともに
モデル統計コンポーネントと
パーティションコンポーネントを使用する必要があります。
2 つのコンポーネントの比較を実行するには、次の手順を実行します。
- Expert Analytics を起動し、データソースに接続して、予測領域に移動します。
- コンポーネントリストから、データ準備セクションを選択します。
- パーティションコンポーネントをドラッグし、分析エディタにドロップします。または、パーティションコンポーネントをダブルクリックします。[OK] をクリックします。
- アルゴリズムセクションで、選択したアルゴリズムをドラッグし分析エディタにドロップします。たとえば、分類問題を解決する場合は、自動分類、R-CNR Tree、単純ベイズ の 3 つの分類アルゴリズムを選択します。
- データ準備セクションから、選択した各アルゴリズムにモデル統計コンポーネントを追加します。これにより、Expert Analytics でアルゴリズムが生成するデータセットに関するパフォーマンス統計を計算できるようになります。
- モデル統計コンポーネントをダブルクリックして設定オプションを表示します。または、コンポーネントのコンテキストメニューアイコンをクリックし、設定を選択します。モデル比較を実行することができるチェーンが設定されます。
- 2 つのモデル統計コンポーネントでパフォーマンス統計を計算するようにターゲット列と予測列を設定します。
- データ準備セクションから、モデル比較コンポーネントを分析エディタに追加します。
- 分析エディタに追加したモデル比較コンポーネントをドラッグし、比較する 2 つのモデル統計コンポーネントの上にドラッグします。すると、モデル比較コンポーネントが、比較するすべてのコンポーネントにリンクされます。
注記 2 つのコンポーネントを比較する場合は、
モデル比較コンポーネントで子ノードを追加することができます。子ノードには次のアイコンが表示されます。

- 比較の設定を開始するには、比較コンポーネントをダブルクリックしてその設定を表示します。または、コンポーネントで設定
アイコンをクリックし、コンテキストメニューから設定を選択します。
- モデル比較ダイアログボックスで、接続されているさまざまなコンポーネントのパフォーマンスを比較する検証用またはテスト用パーティションを選択します。
注記 モデル比較コンポーネントでは、デフォルトで検証用設定が使用されモデルが比較されます。
- パフォーマンス KPI (主要業績評価指標) セクションで、次のいずれかの操作を行います。
- 使用する KPI を選択し、比較する順序を並べ替えます。1 番目の KPI では優れたアルゴリズムを識別できない場合、コンポーネントはリストで 2 番目以降の KPI を使用して計算を実行できるため、順序のコントロールは重要です。
- 矢印をクリックして、KPI を上下に移動し比較順にします。入力コンポーネントは、モデル統計コンポーネントと同じタイプにする必要があります。タイプが異なる場合は、エラーメッセージが表示されます。
- ゲイン比較の割合を指定します。ターゲットポピュレーションの割合は、1% から 100% の間にし、小数点以下は 1 桁 にする必要があります (15.3% など)。
注記 分類の KPI は 7 (KI、KR、KI + KR、AUC、S (KS)、ゲイン %、リフト %) であるのに対し、回帰の KPI は 9 (KI、KR、KI + KR、R2、L1、L2、LInf、ErrorMean 、ErrorStdDev) です。
- 設定を完了したら、完了をクリックします。
- 分析チェーンは完全に設定され、実行する準備ができました。モデル統計コンポーネントの概要に、すべてのパーティションの計算された KPI が表示されます。タイトルはモデル比較コンポーネントで設定した順序で表示されます。テスト用パーティションは、モデル比較コンポーネントが存在し、比較でテストを選択しているときにのみ表示されます。
注記 アルゴリズムまたはモデル統計コンポーネントですべてのパーティションが使用できない場合は、コンポーネントがそれをパーティションを含まないチェーンとして認識しています。
- 分析の実行
アイコンをクリックします。 注記 コンポーネントで、すべてのパーティションのパフォーマンス結果が計算されます。ただし、選択したパーティションのみで、どちらが優れているかが識別されます。比較対象となったコンポーネントのみから最適なコンポーネントが選ばれます。コンポーネントを製品にデプロイする前に、KI 値が 95% より大きいことを確認することをお勧めします。
- 結果タブに、比較結果の概要が表示され、最適なコンポーネントが強調表示されます。フィードバックに次の情報が含まれます。
- パフォーマンスが最適なコンポーネントに、星形のアイコン
が表示されます。これは、アルゴリズムのパフォーマンス統計の比較に基づいています。アルゴリズムは、分類タイプまたは回帰タイプのどちらかになります。概要では、モデルアルゴリズムがパフォーマンス順に表示されます。選択したパーティションに基づいて結果が比較されます。パーティションはテスト用または検証用のどちらかになります。
- タイトルはモデル比較コンポーネントで設定した順序で表示され、比較のために選択したタイトルは太字で表示されます。
- 分類アルゴリズムで、利益またはリフトの割合を指定していない場合は、これらの設定はデフォルトで 10% にされます。
- 必要な場合は、2 つの親コンポーネントを使用しているときに、マッピング画面付きの子ノードをモデル比較コンポーネントに追加することで分析を拡張することができます。そのためには、モデル比較を右クリックして、設定を選択します。または、モデル比較コンポーネントをダブルクリックするか、F5 キーを押します。すると、列名とタイプに基づくデフォルトのマッピングが行われます。
- 必要な場合は、使用する子コンポーネントのマッピングから生成される列に名前を付けます。同じタイプの他の列を追加または削除できます。他のすべての列をマッピングするには、追加の行を手動で追加します。
注記 マッピングした列のデータは、優れていると判定されたほうのコンポーネントから取得されます。設定ウィンドウの列はいずれも空にすることはできません。
- 必要な場合は、最適なモデルをストアドプロシージャとしてエクスポートし、使用できます。そのためには、モデル比較コンポーネントで設定
アイコンをクリックし、表示されるコンテキストメニューからストアドプロシージャとしてエクスポートを選択します。
- 必要な場合は、モデル比較コンポーネントから直接、最適なチェーンを保存してエクスポートできます。そのためには、モデル比較で設定
アイコンをクリックし、表示されるコンテキストメニューからモデルとして保存を選択します。
パーティション、モデル統計、およびモデル比較コンポーネントを合わせて使用し、複数のアルゴリズムを比較して、複雑な分析で使用するのに最適なアルゴリズムを見つけられるようになりました。