HANA 分散テスト

HANA Variance Test アルゴリズムに設定することができるプロパティです。

構文 HANA 分散テストでは、数値データのセットにおける外れ値が特定されます。データの下限と上限は、データの平均と標準偏差、およびユーザが入力した乗数に基づいて計算されます。

乗数は、double 型の係数であり、数値ベクトルのすべての値が範囲内に含まれているかどうかをテストするのに役立ちます。

範囲外の値は、分散テストに合格しないことを意味し、外れ値としてマークされます。

注記 HANA Anomaly Detection (例外検出) アルゴリズムを使用したモデルの作成はサポートされていません。
HANA 分散テストのプロパティ
表 1: アルゴリズムプロパティ
プロパティ 説明
出力モード このアルゴリズムの出力を使用するモードを選択します。
  • 外れ値を表示: 対応する値が外れ値かどうかを示す論理値型の列を入力データに追加します。
  • 外れ値を削除: 外れ値を入力データから削除します。
非依存列 入力ソース列を選択します。
欠落値 欠落値の処理方法を選択します。
指定できる方法:
  • 無視: 非依存列または依存列に欠落値のあるレコードがアルゴリズムでスキップされます。
  • 保持: 計算中は欠落値のあるレコードがアルゴリズムで保持されます。
乗数 乗数値を入力し、外れ値の特定に役立つ下限と上限の範囲を決定します。デフォルト値は 3.0 です。
注記 入力値は正の整数にする必要があります。
スレッド数 実行時にアルゴリズムが使用するスレッドの数を入力します。
予測列名 予測値を含む新しい列の名前を入力します。