HANA R-Random Forest Classification

HANA R-Random Forest Classification アルゴリズムに設定することができるプロパティです。

概要:
Random Forest は、分類アルゴリズムと回帰アルゴリズムに使用する一般的なアンサンブル法です。本アルゴリズムは、学習時にデシジョンツリーのセットを作成して実行します。分類タスクの出力クラスは、フォレストに含まれる個々のデシジョンツリーの多数決に基づきます。このアンサンブル法ではほかの分類アルゴリズムと比べて、ビジネスデータセットに対する精度と一般化が向上します。

本アルゴリズムを実装する R パッケージは randomForest です。

注記

各データセット機能でサポートされる最大レベルは 53 です。

HANA R-Random Forest Classification のプロパティ
表 1: アルゴリズムプロパティ
プロパティ 説明
機能 分析の実行で使用する入力列を選択します。
ターゲット列 分析を実行するターゲット列を選択します。
成長させるツリーの数 Random Forest で成長させる必要のあるツリーの数です。5 以上 1000 以下に設定できます。
最小終点ノード数 デシジョンツリーに含める終点ノードの最小数です。10 以上 500 以下に設定できます。