Cuando se visualice la descripción de datos en el panel, la pestaña Estructuras se añade a la cinta, permitiéndole editar la estructura de datos de las variables.
La última columna de la tabla de descripción indica el estado de la estructura de cada variable. La siguiente tabla lista los posibles estados de una estructura de variable.
| Icono | Estado | Descripción |
|---|---|---|
![]() |
no definido | La codificación de datos determinará automáticamente la agrupación de categorías en función de su interacción con la variable de destino. |
![]() |
No editable | La estructura de una variable de cadena ordinal no se puede modificar. |
![]() |
definido por la extracción de las estadísticas de variables | El usuario debe abrir y validar la estructura de variable. |
![]() |
definido por el usuario o importado de un modelo existente |
Hay diferentes maneras de definir una estructura de variable:
La opción Habilitar la agrupación óptima basada en el destino efectuada por K2C permite que la codificación de datos agrupe los grupos de categorías definidos en la estructura de variable si tienen la misma información.
Una traducción de las categorías de variable no influye en la estructura de variable, que se debe establecer de acuerdo con los valores originales esta.
Extraer la estructura de las estadísticas
Extraer la estructura de una variable
Aparecerá un mensaje cuando la estructura de la variable no esté definida.
Importar la estructura de variable de un modelo
Crear una nueva estructura de variable
que corresponda a la variable de la que desea editar o crear la estructura. Se abrirá la ventana de edición.Si la estructura se ha extraído de las estadísticas de variable o de un modelo, los campos ya se habrán rellenado.
Eliminar la estructura de una variable
Dado que la estructura de una variable depende del tipo de valor de la variable (nominal, ordinal, continua), el editor de estructura varía según el tipo.
Estructura para una variable continua
La estructura de una variable continua está definida por diferentes intervalos compuestos por:
Los intervalos deben ser adyacentes, es decir, no puede haber espacio ni solapamiento entre dos intervalos.
La opción Añadir ausente le permite indicar con qué intervalo se deben agrupar los valores que faltan.
La opción Incluir datos más pequeños le permite incluir en el primer intervalo valores más pequeños que el límite inferior. Del mismo modo, la opción Incluir datos superiores le permite incluir en el último intervalo valores superiores al límite superior.
Estructura para una variable ordinal
La estructura de una variable ordinal es similar a la de una variable continua con la excepción de que los límites siempre están cerrados no pueden modificarse.
La estructura de una variable de cadena ordinal no se puede editar.
Estructura para una variable textual
No se puede editar la estructura de una variable textual.
Estructura para una variable nominal
La estructura de una variable nominal consta de grupos que contienen las categorías de variable.
Si deja la estructura como no definida, la aplicación utiliza un codificador consistente para determinar automáticamente la agrupación de categorías en función de su interacción con la variable de destino. En este caso, puede configurar dos parámetros:
Recuento de bandas para variables continuas
Al trabajar con una estructura no definida, puede establecer el recuento de bandas para variables continuas. Los valores permitidos para este parámetro están entre 1 y 20.
La población se divide entonces en el mismo número de segmentos de tamaño similar. Estos segmentos se utilizan para generar estadísticas descriptivas, concretamente la distribución de variables de destino para cada segmento, que afecta a la codificación de la variable con respecto a las variables de destino.
El recuento de bandas influye en el cálculo del poder predictivo (KI): cuantos más segmentos haya, más preciso es el cálculo del KI para la variable explicativa. Sin embargo, es muy poca la influencia.
| Si desea... | Entonces... |
|---|---|
| modificar el recuento de bandas de todas las variables continuas del modelo |
|
| modificar el recuento de bandas de la variable editada |
|
Agrupación óptima para todas las variables
Al trabajar con una estructura definida, si desea mantener sus categorías como se han definido para la creación del modelo, debe desactivar esta opción.
De lo contrario, o si trabaja con una estructura no definida, Habilitar agrupación óptima para todas las variables permite, en una gran cantidad de casos, aumentar la robustez del modelo (KR) con una pérdida mínima de información (KI). Siempre que sea posible, se recopilan segmentos adyacentes similares para reducir artefactos entre los conjuntos de datos de estimación y validación.