El componente Partición divide los conjuntos de datos en particiones de formación, validación y test. También le proporciona flexibilidad al permitirle configurar el porcentaje de datos necesarios para cada partición.
La mejor forma de crear modelos de análisis predictivos es crear los modelos en los datos de formación (Formación). De esta forma, puede ajustar los parámetros de los algoritmos mientras evalúa el rendimiento del modelo utilizando el conjunto de datos de validación.
Se ajustan los modelos a los datos de formación. El ajuste de los parámetros de modelo se basa en el rendimiento del modelo en el conjunto de datos de validación.
Después de optimizar los parámetros de modelo para un mejor rendimiento, los datos de test se utilizan para seleccionar el modelo que tenga el mejor rendimiento en un conjunto de datos completamente invisibles llamado el conjunto de datos de test.
El componente Partición se utiliza en todos los algoritmos en Expert Analytics, incluyendo PAL, APL y R en los modelos agnósticos y HANA.
Trabaja con el componente Partición en el espacio Predecir. Haga doble clic en el componente Partición en la lista de componentes Preparación de datos en el panel de la derecha. El componente de preprocesador se agrega al editor de análisis y se crea una conexión automática al componente de fuente de datos. Desde el menú contextual del componente de preprocesador, seleccione Configurar propiedades. En la casilla de diálogo de propiedades de componente, introduzca los porcentajes necesarios para los conjuntos de datos de formación, test y validación y haga clic en Finalizado. Para ver los resultados, haga clic en
(Ejecutar análisis).