Selección de las opciones de generación

En función de la selección del menú desplegable Generar, los datos generados contendrán (además de todas las variables clave):

Para un modelo de clasificación/regresión
Si selecciona la opción... Los datos generados contendrán en cada fila...
Solo valor previsto Solo el valor previsto de las observaciones (rr_TargetVariableName)
Probabilidad
  • El valor previsto
  • La probabilidad (proba_rr_TargetVariableName)
  • Las barras de errores (bar_rr_TargetVariableName)
Contribuciones individuales
  • El valor previsto
  • La probabilidad
  • La barra de errores
  • Las contribuciones individuales de variables (contrib_VariableName_rr_TargetVariableName)
Decisión
  • El valor previsto
  • La decisión (decision_rr_TargetVariableName)
  • La probabilidad de decisión (proba_decision_rr_TargetVariableName)
  • La probabilidad

Al seleccionar la opción Decisión en el menú desplegable Generar, puede especificar cuántas observaciones desea que el modelo detecte tras la aplicación en el nuevo conjunto de datos.

Opciones avanzadas de aplicación Esta opción le permite seleccionar las salidas que desea ver en el fichero de resultados.
Utilizar aplicación directa en la base de datos Cuando esta opción esté seleccionada, se utilizará el modo de puntuación optimizado de aplicación en la base de datos y los datos se generarán directamente en la base de datos.
Añadir desviación de puntuación Esta opción le permite comprobar las desviaciones para cada variable y cada categoría de variable entre el modelo y el conjunto de datos de entrada utilizado para la aplicación del modelo.

Usar el modo de aplicación en la base de datos

Este modo de puntuación optimizado permite aplicar el modelo directamente en la base de datos. Evita que se extraigan datos de la base de datos y acelera el proceso de escritura de las salidas de modelo. Este modelo puede utilizarse si se cumplen las siguientes condiciones:

  • El conjunto de datos de aplicación de entrada (tabla, vista, instrucción de selección, tratamiento de datos) y el conjunto de datos de resultados son tablas de la misma base de datos
  • El conjunto de datos de entrada utilizado para crear el modelo contiene al menos una variable declarada como clave
  • El modo Aplicación en la base de datos no está desactivado
  • Tiene los derechos necesarios para leer y escribir en la base de datos
  • Existe una licencia del generador de código válida para la base de datos
  • No se ha producido ningún error

Al seleccionar la opción Utilizar aplicación directa en la base de datos, la opción Añadir desviación de puntuación se selecciona automáticamente.

Para un modelo de agrupación en clústeres
Si selecciona la opción... Los datos generados contendrán en cada fila...
Solo valor previsto
  • El valor de destino
  • El índice del clúster que contiene la observación actual
Codificación disyuntiva de ID de clúster
  • El valor de destino
  • El índice del clúster que contiene la observación actual

La codificación disyuntiva (o codificación ficticia) del número de clústeres.

Significa que, para cada clúster, se crea una variable booleana que indica si la observación actual pertenece a ese clúster (valor 1) o no (valor 0).

Codificación disyuntiva de ID de clúster (+ copia conjunto de datos)
  • El valor de destino
  • El índice del clúster que contiene la observación actual

La codificación disyuntiva (o codificación "ficticia") del índice de clústeres.

Significa que, para cada clúster, se crea una variable booleana que indica si la observación actual pertenece a ese clúster (valor 1) o no (valor 0).

  • Todas las variables de entrada contenidas en el conjunto de datos de aplicación
Media destino ID de clúster
  • El valor de destino
  • El índice del clúster que contiene la observación actual
  • La media de destino del clúster que contiene la fila actual
Para un modelo de codificación de texto
Si selecciona la opción... Los datos generados contendrán en cada fila...
Vectorización

Todas las columnas proporcionadas en el conjunto de datos original

Y para cada campo textual:

  • Se crea una columna para cada raíz identificada por el modelo. Si la raíz representada por la columna está presente en el registro, el valor se establece en 1, de lo contrario, en 0.
  • Una columna muestra el número de elementos que la codificación de texto ha reconocido en el registro
  • Una columna muestra el número de raíces distintas encontradas en el registro
Reconocimiento de idioma

Para cada campo textual:

  • Una columna indica el idioma que la codificación de texto ha reconocido en este registro. El valor puede ser el código ISO del idioma o un valor vacío si no se ha reconocido ningún idioma.
Transaccional
  • Una fila para cada raíz identificada
  • Una columna que contiene el índice clave de la fila original
  • Una columna que contiene el índice de la raíz actual en el campo textual
  • Una columna que indica el campo textual del que se extrae la raíz
  • Una columna que contiene la raíz actual

Este modo transforma cada fila en una secuencia de transacciones, creando conjuntos de datos utilizables en la codificación secuencial.

Generar solo raíces

Para cada campo textual:

  • Se crea una columna para cada raíz identificada por el modelo. Si la raíz representada por la columna está presente en el registro, el valor se establece en 1, de lo contrario, en 0.
  • Una columna muestra el número de elementos que la codificación de texto ha reconocido en el registro
  • Una columna muestra el número de raíces distintas encontradas en el registro
Para un modelo Social

Opciones de generación

Si selecciona la opción... Los datos generados contendrán en cada nodo...
Modo predeterminado
  • Toda la información disponible sobre el nodo y sus vecinos
Modo de círculo
  • El número de vecinos
  • Información adicional sobre los vecinos, si está disponible
  • la media de atributos de vecinos
Modo de centralidad
  • Una evaluación de su centralidad analizando su agrupación en clústeres local y el número de vecinos
Modo de vecinos
  • Una lista de todos los vecinos e información adicional sobre ellos
Modo de descripción
  • La lista de toda la información disponible para este nodo
Modo de comunidad
  • Información sobre la comunidad a la que pertenece así como sobre el rol que desempeña
Modo de emparejamiento de nodos
  • Información sobre su presencia en los grafos y su vecindad (recuento de vecinos, ratio común_vecinos/media_recuento_vecinos)
Opciones avanzadas
  • Información seleccionada por el usuario (clase de nodo, recuento de triángulos, información de vecindad, índice de comunidades, rol de nodo en la comunidad, etc.).

Nota sobre el conjunto de datos de aplicación

Para aplicar un modelo Social a un conjunto de datos, este debe contener las siguientes variables:

  • Una variable para cada población. Por ejemplo, una para clientes y una para productos.
  • La variable kxComIndex, que contiene identificadores de comunidades. Debe ser un entero nominal.

    Esta variable le permite aplicar el modelo en los grafos de comunidad (y pedir vecinos, nodos enumerados en la comunidad o estadísticas agregadas). Puede utilizar esta columna para proporcionar la lista de identificadores de comunidad en la que desee calcular las métricas. Si no aplica el modelo en grafos de comunidad, deberá dejarlo vacío o, si se trata de una base de datos, deberá rellenarla con un valor ficticio, que no se va a utilizar.

Para asegurarse de que los conjuntos de datos son consistentes, utilice la función de asignación del panel Aplicación del modelo.

Usar el modo de aplicación en la base de datos

Este modo de puntuación optimizado permite aplicar el modelo directamente en la base de datos. Evita que se extraigan datos de la base de datos y acelera el proceso de escritura de las salidas de modelo. Este modelo puede utilizarse si se cumplen las siguientes condiciones:

  • El conjunto de datos de aplicación de entrada (tabla, vista, instrucción de selección, tratamiento de datos) y el conjunto de datos de resultados son tablas de la misma base de datos
  • El conjunto de datos de entrada utilizado para crear el modelo contiene al menos una variable declarada como clave
  • El modo Aplicación en la base de datos no está desactivado
  • Tiene los derechos necesarios para leer y escribir en la base de datos
  • Existe una licencia del generador de código válida para la base de datos
  • No se ha producido ningún error
  • El modelo se debe grabar en la base de datos que contiene los conjuntos de datos de aplicación
    Nota

    Si no se ha grabado el modelo, aparece una advertencia y Automated Analytics cambia automáticamente al proceso de aplicación estándar.

Para un modelo de reglas de asociación
Si selecciona la opción... Los datos generados contendrán en cada fila
Solo valor previsto

Las salidas básicas:

  • La clave de sesión
  • El ID de la regla utilizada para encontrar el consecuente
  • El consecuente en sí
Consecuentes optimizados por KI

Las salidas básicas.

Si más de una regla da el mismo consecuente para una sesión, se seleccionará la regla que presente el mejor poder predictivo (KI).

Consecuentes optimizados por confianza

Las salidas básicas

Si más de una regla da el mismo consecuente para una sesión, se seleccionará la regla que presente la mejor confianza.

Valor previsto con descripción de reglas completas

Las salidas ampliadas:

  • La clave de sesión
  • El ID de regla
  • El consecuente
  • El antecedente
  • El poder predictivo (KI)
  • La confianza
  • El soporte de regla
Consecuentes optimizados por KI con descripción de reglas completas

Las salidas ampliadas

Si más de una regla da el mismo consecuente para una sesión, se seleccionará la regla que presente el mejor poder predictivo (KI).

Consecuentes optimizados por confianza con descripción de reglas completas

Las salidas ampliadas

Si más de una regla da el mismo consecuente para una sesión, se seleccionará la regla que presente la mejor confianza.

Para un modelo de serie temporal
Si selecciona la opción... El fichero de resultados contendrá...
Solo valores previstos
  • Todas las variables de entrada
  • Las variables previstas, es decir, la previsión para cada fecha del conjunto de datos de entrenamiento.
Previsiones con sus componentes
  • Todas las variables de entrada
  • Las variables previstas, es decir, la previsión para cada fecha del conjunto de datos de entrenamiento.
  • El valor de los componentes (tendencia, ciclos, fluctuación) de cada previsión
Previsiones con sus componentes y residuos
  • Todas las variables de entrada
  • Las variables previstas, es decir, la previsión para cada fecha del conjunto de datos de entrenamiento.
  • El valor de los componentes (tendencia, ciclos, fluctuación) de cada previsión
  • los valores restantes (residuos) obtenidos tras extraer cada componente de cada previsión
Solo columna de primeras previsiones y sus barras de errores
  • Todas las variables de entrada
  • La primera variable prevista, es decir, la primera previsión para cada fecha del conjunto de datos de entrenamiento.
  • Las barras de errores de la variable prevista