データのパーティショニング

パーティションコンポーネントは、データセットをトレーニングパーティション、確認パーティション、およびテストパーティションに分割します。また、各パーティションに必要なデータの割合を柔軟に設定することもできます。

予測分析モデルを作成する最良の方法は、学習用 (トレーニング) データに基づいてモデルを作成することです。このようにすると、確認データセットを用いてモデルのパフォーマンスを評価しながら、アルゴリズムのパラメータを調整できます。

モデルはトレーニングデータに対してフィットさせます。モデルパラメータのチューニングは、確認データセットにおけるモデルのパフォーマンスに基づいて行います。

モデルパラメータを最適化して最良のパフォーマンスが得られた後で、テストデータを使用して、完全に未知のデータセット (テストデータセット) に対してその最良のパフォーマンスが得られるモデルを選択します。

パーティションコンポーネントでは、その他モデルと HANA モデル両方の PAL、APL、R を含む Expert Analytics のすべてのアルゴリズムを使用します。

パーティションコンポーネントは、予測領域で使用します。右側パネルのデータ準備リストのコンポーネントにあるパーティションコンポーネントをダブルクリックします。プリプロセッサコンポーネントが分析エディタに追加されて、データソースコンポーネントへの接続が自動的に作成されます。プリプロセッサコンポーネントのコンテキストメニューから、プロパティの設定を選択します。コンポーネントのプロパティダイアログボックスでトレーニングデータセット、テストデータセット、確認データセットの必須割合を入力し、完了をクリックします。結果を表示するには、 (分析の実行) を選択します。