Estrategia de partición

Las funciones de SAP Predictive Analytics necesitan dos conjuntos de subdatos obligatorios y uno opcional para la modelación:

  • Estimación: se utiliza para entrenar a los modelos.
  • Validación: se utiliza para garantizar la coherencia o robustez de los modelos.
  • Test (opcional): se utiliza para calcular el indicador de calidad final del modelo.

Para generar sus modelos, hay nueve estrategias de partición que puede utilizar:

  • Una estrategia de partición personalizada, para la que cada conjunto de subdatos puede especificarse explícitamente
  • Ocho estrategias de partición automáticas:
    • Secuencial: los datos originales se asignan de forma secuencial a los conjuntos de subdatos con 3/5 para la estimación, 1/5 para la validación y 1/5 para el test. Este método es la estrategia de partición más rápida.
    • Periódico: los datos originales se asignan periódicamente a los conjuntos de subdatos en grupos de cinco registros de la siguiente manera: los tres primeros a la estimación, el cuarto a la validación y el quinto al test. Esta estrategia se debe utilizar si se debe ignorar el orden de datos original.
    • Aleatorio: los datos originales se asignan de manera aleatoria a los conjuntos de subdatos. Si los datos se clasifican a partir de una variable como age o a partir de la variable de destino, se recomienda utilizar una estrategia de partición aleatoria.
    • Periódico con test al final: estrategia de partición periódica con un test al final.
    • Aleatorio con test al final: partición aleatoria con un test al final.
    • Secuencial sin test: estrategia de partición secuencial que utiliza solo los conjuntos de datos de estimación y validación.
    • Periódico sin test: estrategia de partición periódica que utiliza solo los conjuntos de datos de estimación y validación.
    • Aleatorio sin test (Valor predeterminado): estrategia de partición aleatoria que utiliza solo los conjuntos de datos de estimación y validación.
  • Para seleccionar una estrategia de partición automática
    1. Seleccione la opción Predefinido.
    2. En la lista seleccione la estrategia de partición que desee utilizar.
    3. Haga clic en el botón Siguiente. Se visualiza el panel Datos a modelar.
  • Para seleccionar la estrategia de partición personalizada
    1. Haga clic en la opción Personalizar.
    2. Utilice el botón Navegar correspondiente al campo Estimación para seleccionar el conjunto de datos que se va a utilizar como conjunto de datos de estimación.
    3. Utilice el botón Navegar correspondiente al campo Validación para seleccionar el conjunto de datos que se va a utilizar como conjunto de datos de validación.
    4. Si desea utilizar un conjunto de datos de test, utilice el botón Navegar correspondiente al campo Test para seleccionar el conjunto de datos que se va a utilizar. De lo contrario, deje el campo vacío.
    5. Haga clic en el botón Siguiente. Se visualiza el panel Datos a modelar.