数据分区

分区部件将数据集拆分为训练、验证和测试分区。用户可灵活配置各分区所需数据的百分比。

构建预测分析模型的最佳方式是构建训练数据模型。通过这种方式,用户可在使用验证数据集评估模型性能时调整算法参数。

模型与训练数据拟合。模型参数调整是基于验证数据集中模型的性能。

模型参数优化到最佳性能后,测试数据用于在名为测试数据集的完全不可见数据集中选取具备最佳性能的模型。

分区部件用于 Expert Analytics 中的所有算法,包括未知模型和 HANA 模型中的 PAL、APL 和 R。

“预测”空间使用分区部件。在右侧面板中,双击部件数据准备列表下的“分区”部件。预处理器部件将添加到分析编辑器中,并创建到数据源部件的自动连接。从预处理器部件的上下文菜单中选择“配置属性”。在“部件属性”对话框,输入训练、测试和验证数据集的所需百分比,然后单击“完成”。要查看结果,请单击 (运行分析)。