Puede utilizar este panel para seleccionar una variable como estimador de la variable de destino o para especificar índices de clúster.
Estimador de destino
Un estimador de destino es una variable que puede utilizarse para predecir el comportamiento de la variable de destino. Utilizar un estimador de destino es equivalente a crear un modelo.
Si no existe ninguna variable que pueda utilizarse como estimador del destino en su conjunto de datos, deje este panel en blanco.
Nota: Solo pueden utilizarse como estimadores las variables continuas.
- Para seleccionar un estimador del destino
- Seleccione la tabla Estimador de destino.
- En la columna Variables, haga clic en la variable que desea utilizar como estimador.
- Haga clic en la celda correspondiente de la columna Es un estimador de. Se visualiza una lista de los destinos disponibles.
- Seleccione el destino por estimar.
Estimador de clúster
Al utilizar un conjunto de datos que es un resultado de una aplicación de modelo y que contiene clústeres identificados para cada registro, esta pestaña le permite indicar las columnas que contienen los índices de clúster. Puede resultar útil generar estadísticas, por ejemplo del tamaño de cada clúster y la suma residual de cuadrados en esos clústeres. Uno de los usos corrientes es la comparación de los resultados de agrupación en clústeres obtenidos gracias a diferentes herramientas o con diferentes métodos.
- Para añadir un estimador de clúster
- Seleccione la pestaña Estimador de clúster.
- Haga clic en el botón Añadir estimador. Se añade una variable a la lista de estimadores.
- Haga clic en el nombre de la variable para visualizar la lista de todas las variables nominales del conjunto de datos.
- Seleccione de la lista la variable que contiene el índice de clústeres.
- Si la agrupación en clústeres utilizada para generar el índice de clústeres ha sido supervisada (es decir, una variable de destino), seleccione el Destino de clúster.
- Repita los pasos 2 a 5, si existe más de un índice de clústeres. Por ejemplo, si el conjunto de datos contiene los resultados de dos herramientas de agrupación en clústeres distintas, para que pueda comparar las estadísticas directamente en el mismo conjunto de datos.
- En la lista Distancia, situada debajo de la lista de estimadores, seleccione la distancia utilizada para evaluar la proximidad de dos individuales determinados en el modelo de agrupación en clústeres original.
- En la lista Codificación, situada debajo de la lista de estimadores, seleccione la codificación utilizada en el modelo de agrupación en clústeres original. La codificación utilizada de forma predeterminada al genera un modelo de agrupación en clústeres con Automated Analytics es:
- Media de destino, si el modelo está supervisado,
- No supervisado, en caso contrario.
Nota Si el conjunto de datos contiene resultados de varios modelos, esos deben haber sido generados utilizando la misma métrica de distancia y codificación.
- Una vez indicados todos los estimadores de clústeres, haga clic en el botón Validar.
- Para eliminar un estimador de clúster
- Seleccione la variable de estimador a eliminar.
- Haga clic en el botón Eliminar estimador.