Máquina de vectores de soporte de HANA

Propiedades que se pueden configurar para el algoritmo de la máquina de vectores de soporte de HANA.

Sintaxis

Las máquinas de vectores de soporte (SVMs) son un conjunto de modelos de aprendizaje supervisado que utilizan el concepto de vector de soporte. En comparación con otros muchos modelos de aprendizaje supervisado, las SVMs presentan ventajas, tales como que la producción de modelos tanto lineales como no lineales. Estas últimas se alcanzan mediante una técnica denominada función Kernel.

Como en la mayoría de modelos supervisados, SVMs tienen fases de formación y de evaluación. Durante la fase de entrenamiento, se aprende que una función f(x):->y donde f(∙), es una función (puede ser no lineal) que asigna un ejemplo en un DESTINO. El entrenamiento consiste en pares indicados mediante {xi, yi}, donde x indica un ejemplo que se representa con distintos atributos, y y indica un DESTINO (información supervisada). Durante la fase de evaluación, el f(∙) aprendido se utiliza después para asignar un ejemplo con un DESTINO desconocido en su DESTINO predicho.

En la implementación actual en PAL se pueden utilizar las SVMs para las tres tareas siguientes:
  • Clasificación de vectores de soporte (SVC)

    La clasificación es una de las tareas más frecuentes de muchos campos, tales como el aprendizaje de máquinas, la minería de datos, la visión de ordenadores o el análisis de datos empresariales. En comparación con clasificadores lineales tales como la regresión logística, la SVC es capaz de producir un límite de decisión no lineal que lleve a una mejor precisión en algunos conjuntos de datos del mundo real. En un supuesto de clasificación, f(∙) indicaría una función de decisión y OBJETIVO una "etiqueta" representada por un número real.

  • Regresión de vectores de soporte (SVR)

    La SVR consiste en otro método de análisis de regresión. En comparación con métodos de regresión lineales clásicos como la regresión de mínimos cuadrados, la función de regresión en la SVR puede ser no lineal. En un supuesto de regresión, f(∙) indicaría una función de regresión y OBJETIVO una "respuesta" representada por un número real.

  • Clasificación de vectores de soporte

    Esto implementa un algoritmo emparejado de "aprendizaje de clasificación" que aprende una función de clasificación a partir de diversos conjuntos (que se distinguen gracias al ID de consulta) de ejemplos clasificados. En un supuesto de clasificación, f(∙) indicaría una función de clasificación y OBJETIVO una puntuación según se haya realizado la clasificación final. Para la clasificación emparejada, se aprendef(∙) con el fin de que se considere la relación emparejada que expresa la clasificación de los ejemplos dentro de cada conjunto.

Ya que la función Kernel (además de los conjuntos de datos) alcanza la no linealidad, se deben especificar también el tipo de kernel y los parámetros.

Propiedades de la máquina de vectores de soporte de HANA
Tabla 1: Propiedades del algoritmo
Propiedad Descripción
Tipo de algoritmo Seleccione el tipo de análisis debe ejecutar el algoritmo.
  • Clasificación
  • Regresión
  • Clasificación
Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo.
Características Seleccione las columnas de entrada con las que desea realizar el análisis.
Variable de destino Seleccione la columna de destino en la que desea realizar el análisis.
ID de consulta Seleccione una columna de ID de consulta para la clasificación.
Valores faltantes Seleccione el método para manejar los valores perdidos.
Valores posibles:
  • Omitir: el algoritmo omite los registros que contienen valores faltantes en las columnas independientes o dependientes.
  • Conservar: el algoritmo conserva los registros que contienen los valores faltantes durante el cálculo.
Tipo de kernel Seleccione el tipo de kernel.
Gamma Introduzca el coeficiente gamma para el kernel RBF.
Margen máximo Introduzca un valor de intercambio que desee tener en cuenta entre el error de entrenamiento y margen.
Grado Indique un grado para el kernel polinomial. El valor predeterminado es 3.
Coeficiente lineal Introduzca un valor para el coeficiente lineal.
Constante de coeficiente Introduzca un valor para la constante de coeficiente.
Validación cruzada Seleccione esta opción para usar la validación cruzada para el cálculo.
Tipo de normalización Seleccione el tipo de normalización.
Número de subprocesos Introduzca el número de subprocesos que debe usar el algoritmo para la ejecución. El valor predeterminado es 1.
Nombre de columna prevista Introduzca un nombre para la columna creada recientemente que contiene los valores previstos.