R-CNR Tree (R CNR ツリー)

R-CNR Tree アルゴリズム用に設定できるプロパティです。

構文 このアルゴリズムを使用して、他の変数に基づいて監視をグループに分類し、1 つ以上の離散変数を予測します。ただし、このアルゴリズムを使用して、データのトレンドを検出することもできます。
注記
  • R 2.15 に付属する "rpart" パッケージでは、スペースまたは特殊文字を含む列名を処理できません。"rpart" パッケージでは、R データフレームでサポートされている入力列名の形式のみに対応しています。
  • モデルのスコアリング時に使用される非依存列の名前と、モデルの作成時に使用される非依存列の名前は同じにする必要があります。
  • スペース、またはピリオド (.) 以外の特殊文字を含む列名はサポートされていません。
R-CNR Tree (R CNR ツリー) のプロパティ
表 1: アルゴリズムプロパティ
プロパティ 説明
出力モード このアルゴリズムの出力を使用するモードを選択します。
指定できる値
  • トレンド: 依存列の値を予測して、予測値を含む出力に列を追加します。
  • 追加: ターゲット列の欠落値に文字を追加します。
機能 分析の実行で使用する入力列を選択します。
ターゲット変数 分析を実行するターゲット列を選択します。
欠落値 欠落値の処理方法を選択します。
指定できる方法
  • Rpart: 依存列が欠落しているすべての監視がアルゴリズムで削除されます。ただし、1 つ以上の非依存列が欠落している監視は保持されます。
  • 無視: 非依存列または依存列に欠落値のあるレコードがアルゴリズムでスキップされます。
  • 保持: 欠落値のあるレコードが計算時にアルゴリズムで保持されます。
  • 停止: 非依存列または依存列の値が欠落している場合、アルゴリズムは実行を停止します。
アルゴリズムタイプ アルゴリズムで実行される分析のタイプを選択します。
指定できる値
  • 分類: 従属変数にカテゴリ値がある場合、このタイプを使用します。
  • 回帰: 従属変数に数値がある場合、このタイプを使用します。
最小分割 ノードを分割するのに必要な最小監視数を入力します。デフォルト値は 10 です。
分割基準 ノードの分割基準を選択します。
指定できる値
  • Gini: Gini 不純度。
  • 情報: 情報ゲイン。
予測列名 予測値が含まれる新規作成列の名前を入力します。
複雑性パラメータ フィットを改善しないすべての分割を回避することで計算時間を短縮する複雑性パラメータを入力します。デフォルト値は 0.005 です。
最大深さ 最終ツリーの最大ノードレベルを入力します (ルートノードをレベル 0 としてカウント)。
注記 最大深さが 30 を超える場合、アルゴリズムで想定どおりの結果が生成されません (32 ビットマシンの場合)。
クロス確認 クロス確認の数を入力します。クロス確認値が高いほど、計算時間が長くなり、生成される結果の精度が向上します。
前可能性 前可能性のベクトルを入力します。
サロゲートを使用 分割プロセスで使用するサロゲートを選択します。
指定できる値
  • 表示のみ: 1 次分割ルールの欠落値がある監視は、それ以上ツリーの下に送られません。
  • サロゲートを使用: 1 次変数が欠落しているサブジェクトを分割する場合、このオプションを使用します。すべてのサロゲートが欠落している場合、監視は分割されません。
  • 欠落している場合停止: すべてのサロゲートが欠落している場合、アルゴリズムは監視を大多数の方向に送ります。
サロゲートスタイル 最善のサロゲートの選択を制御するスタイルを入力します。
指定できる値
  • 合計正確分類を使用: アルゴリズムでは、正確分類の合計数を使用して、潜在的なサロゲート変数が検出されます。
  • 非欠落ケースのパーセントを使用: アルゴリズムでは、分類された非欠落ケースのパーセントを使用して、潜在的なサロゲートが検出されます。
最大サロゲート ツリーの各ノードで保持されるサロゲートの最大数を入力します。
確率の表示 確率の表示チェックボックスをオンにすると、分類モデルのスコアリング中に予測値の確率を取得します。