En función de la selección del menú desplegable Generar, los datos generados contendrán (además de todas las variables clave):
| Si selecciona la opción... | Los datos generados contendrán en cada fila... |
|---|---|
| Solo valor previsto | Solo el valor previsto de las observaciones (rr_TargetVariableName) |
| Probabilidad |
|
| Contribuciones individuales |
|
| Decisión |
Al seleccionar la opción Decisión en el menú desplegable Generar, puede especificar cuántas observaciones desea que el modelo detecte tras la aplicación en el nuevo conjunto de datos. |
| Opciones avanzadas de aplicación | Esta opción le permite seleccionar las salidas que desea ver en el fichero de resultados. |
| Utilizar aplicación directa en la base de datos | Cuando esta opción esté seleccionada, se utilizará el modo de puntuación optimizado de aplicación en la base de datos y los datos se generarán directamente en la base de datos. |
| Añadir desviación de puntuación | Esta opción le permite comprobar las desviaciones para cada variable y cada categoría de variable entre el modelo y el conjunto de datos de entrada utilizado para la aplicación del modelo. |
Usar el modo de aplicación en la base de datos
Este modo de puntuación optimizado permite aplicar el modelo directamente en la base de datos. Evita que se extraigan datos de la base de datos y acelera el proceso de escritura de las salidas de modelo. Este modelo puede utilizarse si se cumplen las siguientes condiciones:
Al seleccionar la opción Utilizar aplicación directa en la base de datos, la opción Añadir desviación de puntuación se selecciona automáticamente.
| Si selecciona la opción... | Los datos generados contendrán en cada fila... |
|---|---|
| Solo valor previsto |
|
| Codificación disyuntiva de ID de clúster |
La codificación disyuntiva (o codificación ficticia) del número de clústeres. Significa que, para cada clúster, se crea una variable booleana que indica si la observación actual pertenece a ese clúster (valor 1) o no (valor 0). |
| Codificación disyuntiva de ID de clúster (+ copia conjunto de datos) |
La codificación disyuntiva (o codificación "ficticia") del índice de clústeres. Significa que, para cada clúster, se crea una variable booleana que indica si la observación actual pertenece a ese clúster (valor 1) o no (valor 0).
|
| Media destino ID de clúster |
|
| Si selecciona la opción... | Los datos generados contendrán en cada fila... |
|---|---|
| Vectorización | Todas las columnas proporcionadas en el conjunto de datos original Y para cada campo textual:
|
| Reconocimiento de idioma | Para cada campo textual:
|
| Transaccional |
Este modo transforma cada fila en una secuencia de transacciones, creando conjuntos de datos utilizables en la codificación secuencial. |
| Generar solo raíces | Para cada campo textual:
|
Opciones de generación
| Si selecciona la opción... | Los datos generados contendrán en cada nodo... |
|---|---|
| Modo predeterminado |
|
| Modo de círculo |
|
| Modo de centralidad |
|
| Modo de vecinos |
|
| Modo de descripción |
|
| Modo de comunidad |
|
| Modo de emparejamiento de nodos |
|
| Opciones avanzadas |
|
Nota sobre el conjunto de datos de aplicación
Para aplicar un modelo Social a un conjunto de datos, este debe contener las siguientes variables:
La variable kxComIndex, que contiene identificadores de comunidades. Debe ser un entero nominal.
Esta variable le permite aplicar el modelo en los grafos de comunidad (y pedir vecinos, nodos enumerados en la comunidad o estadísticas agregadas). Puede utilizar esta columna para proporcionar la lista de identificadores de comunidad en la que desee calcular las métricas. Si no aplica el modelo en grafos de comunidad, deberá dejarlo vacío o, si se trata de una base de datos, deberá rellenarla con un valor ficticio, que no se va a utilizar.
Para asegurarse de que los conjuntos de datos son consistentes, utilice la función de asignación del panel Aplicación del modelo.
Usar el modo de aplicación en la base de datos
Este modo de puntuación optimizado permite aplicar el modelo directamente en la base de datos. Evita que se extraigan datos de la base de datos y acelera el proceso de escritura de las salidas de modelo. Este modelo puede utilizarse si se cumplen las siguientes condiciones:
Si no se ha grabado el modelo, aparece una advertencia y Automated Analytics cambia automáticamente al proceso de aplicación estándar.
| Si selecciona la opción... | Los datos generados contendrán en cada fila |
|---|---|
| Solo valor previsto | Las salidas básicas:
|
| Consecuentes optimizados por KI | Las salidas básicas. Si más de una regla da el mismo consecuente para una sesión, se seleccionará la regla que presente el mejor poder predictivo (KI). |
| Consecuentes optimizados por confianza | Las salidas básicas Si más de una regla da el mismo consecuente para una sesión, se seleccionará la regla que presente la mejor confianza. |
| Valor previsto con descripción de reglas completas | Las salidas ampliadas:
|
| Consecuentes optimizados por KI con descripción de reglas completas | Las salidas ampliadas Si más de una regla da el mismo consecuente para una sesión, se seleccionará la regla que presente el mejor poder predictivo (KI). |
| Consecuentes optimizados por confianza con descripción de reglas completas | Las salidas ampliadas Si más de una regla da el mismo consecuente para una sesión, se seleccionará la regla que presente la mejor confianza. |
| Si selecciona la opción... | El fichero de resultados contendrá... |
|---|---|
| Solo valores previstos |
|
| Previsiones con sus componentes |
|
| Previsiones con sus componentes y residuos |
|
| Solo columna de primeras previsiones y sus barras de errores |
|