HANA R-Apriori アルゴリズム用に設定できるプロパティです。
このアルゴリズムを使用して、大きなトランザクションデータセットの頻出する項目セットのパターンを検出し、関係ルールを生成します ("arules" R パッケージを使用)。 このアルゴリズムは、顧客が同時に購入する傾向にある製品やサービスを把握するために使用されます。 関係分析を使用して顧客の購入トレンドを分析すると、その顧客の将来の行動を予測できます。
たとえば、靴を購入する顧客は同時に靴下も購入する傾向にあるという情報を、Shoes=> Socks [support = 0.5, confidence= 0.1] のように、最小サポートおよび最小信頼性を指定した関係ルールとして表すことができます。
| プロパティ | 説明 |
|---|---|
| 出力モード | このアルゴリズムの出力を使用するモードを選択します。 |
| 入力形式 | 入力データの形式を選択します。 |
| 項目列 | アルゴリズムを適用する項目を含む列を選択します。 |
| トランザクション ID 列 | アルゴリズムを適用するトランザクション ID を含む列を選択します。 |
| サポート | 項目の最小サポートの値を入力します。 |
| 信頼性 | ルール/関係の最小信頼性の値を入力します。 |
| ルール | 指定したデータセットの Apriori ルールを含む新しい列の名前を入力します。 |
| サポート値 | 対応するルールのサポートを含む新しい列の名前を入力します。 |
| 信頼値 | 対応するルールの信頼値を含む新しい列の名前を入力します。 |
| リフト値 | 対応するルールのリフト値を含む新しい列の名前を入力します。 |
| トランザクション ID | トランザクション ID を含む新しい列の名前を入力します。 |
| 項目 | 項目名を含む新しい列の名前を入力します。 |
| マッチングルール | マッチングルールを含む新しい列の名前を入力します。 |
| 左側の項目 | ルールまたは項目セットの左側に表示される項目のカンマ区切りラベルを入力します。 |
| 右側の項目 | ルールまたは項目セットの右側に表示される項目のカンマ区切りラベルを入力します。 |
| 両側の項目 | ルールまたは項目セットの両側に表示される項目のカンマ区切りラベルを入力します。 |
| 項目なし | ルールまたは項目セットに表示する必要のない項目のカンマ区切りラベルを入力します。 |
| デフォルト表示 | 明示的に指定されていない項目のデフォルト表示を入力します。 |
| 並べ替えタイプ | 頻度で項目を並べ替える場合、この並べ替えオプションを選択します。 |
| フィルタ基準 | トランザクションから未使用項目をフィルタリングする方法を示す数値を入力します。 デフォルト値は 0.1 です。 |
| ツリー構造を使用 | トランザクションを接頭辞ツリーとして整理するには、True を選択します。 |
| ヒープソートを使用 | トランザクションの並び替えにクイックソートではなくヒープソートを使用するには、True を選択します。 |
| メモリの最適化 | 速度を最大化するのではなくメモリ使用量を最小化するには、True を選択します。 |
| トランザクションをメモリにロード | トランザクションをメモリにロードするには、True を選択します。 |