Las funciones de SAP Predictive Analytics necesitan dos conjuntos de subdatos obligatorios y uno opcional para la modelación:
- Estimación: se utiliza para entrenar a los modelos.
- Validación: se utiliza para garantizar la coherencia o robustez de los modelos.
- Test (opcional): se utiliza para calcular el indicador de calidad final del modelo.
Para generar sus modelos, hay nueve estrategias de partición que puede utilizar:
- Una estrategia de partición personalizada, para la que cada conjunto de subdatos puede especificarse explícitamente
- Ocho estrategias de partición automáticas:
- Secuencial: los datos originales se asignan de forma secuencial a los conjuntos de subdatos con 3/5 para la estimación, 1/5 para la validación y 1/5 para el test. Este método es la estrategia de partición más rápida.
- Periódico: los datos originales se asignan periódicamente a los conjuntos de subdatos en grupos de cinco registros de la siguiente manera: los tres primeros a la estimación, el cuarto a la validación y el quinto al test. Esta estrategia se debe utilizar si se debe ignorar el orden de datos original.
- Aleatorio: los datos originales se asignan de manera aleatoria a los conjuntos de subdatos. Si los datos se clasifican a partir de una variable como age o a partir de la variable de destino, se recomienda utilizar una estrategia de partición aleatoria.
- Periódico con test al final: estrategia de partición periódica con un test al final.
- Aleatorio con test al final: partición aleatoria con un test al final.
- Secuencial sin test: estrategia de partición secuencial que utiliza solo los conjuntos de datos de estimación y validación.
- Periódico sin test: estrategia de partición periódica que utiliza solo los conjuntos de datos de estimación y validación.
- Aleatorio sin test (Valor predeterminado): estrategia de partición aleatoria que utiliza solo los conjuntos de datos de estimación y validación.
- Para seleccionar una estrategia de partición automática
- Seleccione la opción Predefinido.
- En la lista seleccione la estrategia de partición que desee utilizar.
- Haga clic en el botón Siguiente. Se visualiza el panel Datos a modelar.
- Para seleccionar la estrategia de partición personalizada
- Haga clic en la opción Personalizar.
- Utilice el botón Navegar correspondiente al campo Estimación para seleccionar el conjunto de datos que se va a utilizar como conjunto de datos de estimación.
- Utilice el botón Navegar correspondiente al campo Validación para seleccionar el conjunto de datos que se va a utilizar como conjunto de datos de validación.
- Si desea utilizar un conjunto de datos de test, utilice el botón Navegar correspondiente al campo Test para seleccionar el conjunto de datos que se va a utilizar. De lo contrario, deje el campo vacío.
- Haga clic en el botón Siguiente. Se visualiza el panel Datos a modelar.