As propriedades que podem ser configuradas para o algoritmo Máquina de vetores de suporte HANA.
As máquinas de vetores de suporte (SVMs) se referem a uma família de modelos de aprendizagem supervisionada que utiliza o conceito de vetor de suporte. Em comparação com muitos outros modelos de aprendizagem supervisionada, as SVMs levam vantagem porque os modelos por elas produzidos podem ser lineares ou não lineares, sendo que os últimos são realizados por uma técnica chamada Kernel Trick (Truque de função kernel [de núcleo]).
Como a maioria dos modelos supervisionados, as SVMs tem fases de treinamento e de teste. Na fase de treinamento, aprende-se sobre uma função f(x):->y onde f(∙) é uma função (pode ser não linear) mapeando uma amostra em um DESTINO. O conjunto de treinamento consiste em pares indicados por {xi, yi}, onde xindica uma amostra representada por vários atributos e y indica um DESTINO (informações supervisionadas). Na fase de testes, a função aprendida f(∙) é utilizada adicionalmente para mapear uma amostra com DESTINO desconhecido em um DESTINO previsto.
A classificação é uma das tarefas mais frequentes em muitos campos, inclusive aprendizagem por máquina, mineração de dados, visão computacional e análise de dados comerciais. Em comparação com classificadores lineares como regressão logística, a SVC está apta a produzir limite decisório não linear que leva a melhor precisão em alguns conjuntos de dados do mundo real. No cenário de classificação, f(∙) se refere à função de decisão e um DESTINO se refere à "etiqueta" representada por um número real.
SVR é um outro método para análise de regressão. Em comparação com métodos clássicos de regressão linear, como regressão de mínimos quadrados, a função de regressão em SVR pode ser não linear. No cenário de regressão, f(∙) se refere à função de regressão e um DESTINO se refere à "resposta" representada por um número real.
Isso implementa um algoritmo de "aprendizagem de ranking" de pares que aprende sobre uma função a partir de vários conjuntos (distintos por ID da consulta) e amostras sob ranking. No cenário de ranking, f(∙) se refere à função de ranking e DESTINO se refere à pontuação, a partir da qual o ranking final é feito. Para ranking de pares, f(∙) é aprendida de modo que é considerada a relação de pares expressando o rank das amostras dentro de cada conjunto.
Devido ao fato da não linearidade ser realizada via Kernel Trick, além dos conjuntos de dados os parâmetros e tipo de kernel devem também ser especificados.
| Propriedade | Descrição |
|---|---|
| Tipo de algoritmo | Selecione o tipo de análise que o algoritmo deva executar.
|
| Modo de saída | Selecione o modo pelo qual você deseja utilizar a saída desse algoritmo. |
| Recursos | Selecione as colunas de entrada com as quais você deseje executar a análise. |
| Variável de destino | Selecione a coluna de destino na qual você deseja executar a análise. |
| ID da consulta | Selecione uma coluna de ID da consulta para Ranking. |
| Valores em falta | Selecione o método para manipulação dos valores em falta. Valores possíveis:
|
| Tipo de kernel | Selecione o tipo de kernel. |
| Gama | Insira o coeficiente gama para o kernel RBF. |
| Margem máxima | Insira um valor de substitutibilidade que você deseje considerar entre o erro e a margem de treinamento. |
| Grau | Insira um grau para kernel polinomial. O valor predeterminado é 3. |
| Coeficiente linear | Insira um valor para coeficiente linear. |
| Constante de coeficiente | Insira um valor para constante de coeficiente. |
| Validação cruzada | Selecione essa opção para utilizar validação cruzada para cálculo. |
| Tipo de normalização | Selecione o tipo de normalização. |
| Número de threads | Insira o número de threads que o algoritmo deva utilizar para execução. O valor predeterminado é 1. |
| Nome da coluna prevista | Insira um nome para a coluna recém-criada que contenha os valores previstos. |