Para todas las estrategias de partición excepto la Personalizada, se puede realizar un submuestreo del conjunto de datos de entrenamiento. Haga clic en el botón
(Opciones avanzadas) para visualizar la pantalla Submuestreo.
Para realizar un submuestreo se puede:
- Seleccionar una primera y última línea específicas de los datos originales.
- Seleccionar aleatoriamente una proporción de los datos originales. Puede utilizarse una semilla aleatoria para seleccionar los mismos registros de los datos originales al realizar el submuestreo.
- Utilizar simultáneamente la selección de línea y el submuestreo aleatorio.
- Para establecer un submuestreo aleatorio
- Seleccione la opción Selección aleatoria.
- En la sección Selección aleatoria, utilice la barra de desplazamiento Proporción para seleccionar el porcentaje del conjunto de datos original que desee conservar.
- En el campo Semilla aleatoria, introduzca un valor de semilla para el submuestreo. El valor de semilla se establece de forma predeterminada en 1960.
- En la barra de Proporción, utilice el cursor para seleccionar la proporción de observación que desea en el conjunto de datos. La selección aleatoria genera un índice aleatorio para cada fila en el conjunto de datos basándose en la semilla. Misma semilla, mismo índice.
Puede afinar la selección marcando la opción Avanzado. Esta barra se sustituye por dos campos que le permiten indicar el rango correspondiente a los índices que se mantienen. Por ejemplo, si selecciona [0, 20%] seleccionará las filas con un índice entre 0 y 0,2 por lo que [0, 20%] no representa las mismas filas que [80%, 100%](índices entre 0,8 y 1), de hecho, si desea un aprendizaje en el 80% del conjunto de datos y una aplicación en el otro 20% y realizar el submuestreo aleatorio, esta es la única manera de hacerlo. Así puede crear dos conjuntos de datos complementarios manteniendo las mismas opciones de cursor y de semilla y seleccionando dos rangos complementarios.
- Para establecer una selección de línea
- Seleccione la opción Selección de línea.
- En el campo Primera línea, introduzca el número de línea por el que desea que empiece su conjunto de datos de submuestreo.
- En el campo Última línea, introduzca el número de línea por el que desea que termine su conjunto de datos de submuestreo.
- Después de especificar el submuestreo, haga clic en el botón De acuerdo para grabar las opciones y cerrar la ventana Opciones.