O componente Partição divide os conjuntos de dados nas partições Treinamento, Validação e Teste. Ele também oferece flexibilidade, permitindo que você configure a porcentagem de dados necessária para cada partição.
A melhor maneira de criar modelos de análise preditiva é com base nos dados de Treinamento. Dessa forma, você pode ajustar os parâmetros dos algoritmos enquanto avalia o desempenho do modelo usando o conjunto de dados Validação.
Os modelos são ajustados de acordo com os dados de treinamento. O ajuste dos parâmetros do modelo é feito com base no desempenho do modelo no conjunto de dados Validação.
Depois que os parâmetros do modelo são otimizados para o desempenho ideal, os dados de teste são usados para escolher o modelo que tem o melhor desempenho em um conjunto de dados completamente inesperado, chamado de Teste.
O componente Partição é usado em todos os algoritmos no Expert Analytics, incluindo PAL, APL e R nos modelos do HANA e em modelos de terceiros.
Você trabalha com o componente Partição na divisão Prever. Clique duas vezes em Partição na lista de componentes de Preparação de dados no painel à direita. O componente pré-processador será adicionado ao editor de análise, e uma conexão automática será criada para o componente de fonte de dados. No menu de contexto do componente pré-processador, escolha Configurar propriedades. Na caixa de diálogo Propriedades do componente, insira as porcentagens necessárias para os conjuntos de dados Treinamento, Teste e Validação, em seguida, clique em Concluído. Para visualizar os resultados, clique em
(Executar análise).