Utilize o Componente de Estatísticas de Modelos para gerar estatísticas de desempenho para solucionar problemas de duas classes para todos os cenários (HANA ou não HANA). Visualize e compartilhe resultados em uma variedade de gráficos. Use o componente com o componente de Comparação de Modelos para comparar dois ou mais modelos e descobrir o melhor para um problema preditivo.
Estatísticas de modelo é um componente que calcula as estatísticas de desempenho em conjuntos de dados gerados por algoritmos. Ele pode fazer isso para dois tipos de algoritmos, classificação e regressão. Além disso, é possível configurar o componente para gerar estatísticas de desempenho para conjuntos de dados de Treinamento, Validação e Teste e KPIs selecionados.
O componente funciona apenas com problemas de duas classes. Um problema de duas classes é um problema empresarial com um resultado binário, o que significa que ele classifica os elementos em um determinado conjunto de dados em dois grupos com base através de uma regra de classificação.
Um exemplo é uma modelagem de desistência para um negócio com um serviço de assinatura. Em tal caso, o problema de duas classes é identificar os assinantes que permanecerão no serviço e os que o deixarão.
Outro exemplo é a detecção de fraudes em uma instituição financeira, em que o problema de duas classes é identificar quais transações são fraudulentas e quais não são.
Você deve assegurar que a qualidade preditiva (Ki) do modelo seja forte. Por exemplo, se a Ki for zero, isso significa que o modelo não é bem treinado e não inspira confiança, uma vez que ele é essencialmente equivalente a um modelo aleatório.
O Ki está diretamente vinculado à quantidade de informações disponíveis para prever a meta. Portanto, você pode melhorar o KI aumentando o número de variáveis úteis no modelo das seguintes maneiras:
Você pode gerar e compartilhar gráficos para algoritmos de classificação e regressão no componente de Estatísticas de Modelo. O gráfico visualiza o desempenho dos algoritmos de Classificação e de Regressão.
Você pode usar o componente Estatísticas de Modelo com componente de Comparação de Modelos para aprender o melhor algoritmo para seu problema preditivo. Primeiro o componente de Estatísticas de Modelo calcula as estatísticas de desempenho para tipos de algoritmo de classificação ou regressão. Depois disso o componente de Comparação de Modelos compara as estatísticas de desempeno calculado para buscar o melhor algoritmo entre os operados durante a execução.
Observe que ao alterar as configurações no componente de Estatísticas de Modelo isso afeta o componente de Comparação de Modelos.
Na renderização dos gráficos na interação com o componente de Comparação de Modelos, o componente de Estatísticas de Modelo sobrepõe as partições sobre cada um e mostra resultados diferentes por partição. O componente de Comparação de Modelos faz o mesmo pois ambos os componentes usam os mesmos dados. Por isso é necessário assegurar a configuração dos KPIs para ambos exatamente da mesma forma.
Quando o componente de Partição é incluído antes do componente de Estatísticas de Modelo em uma cadeia de análise você tem a opção de usar três diferentes partições: Treinamento, Teste e Validação. Se o componente de Partição não estiver incluído, o componente de Estatísticas de Modelo exibe um conjunto de estatísticas e gráficos somente para a partição Treinamento.