HANA de valor médio K

As propriedades que podem ser configuradas no algoritmo HANA de valor médio K.

Sintaxe Use este algoritmo para formar grupos de observações relacionadas sem qualquer conhecimento anterior das relações. O algoritmo agrupa observações em grupos k, em que k é fornecido como parâmetro de entrada. O algoritmo atribui cada observação a clusters com base na proximidade da observação com o valor médio do cluster. O processo continua até ocorrer a convergência dos clusters.
Nota
  • Você poderá obter um número diferente de clusters para cada cluster toda vez que executar o algoritmo HANA de valor médio K. No entanto, as observações em cada cluster permanecem iguais.
  • A criação de modelos usando o algoritmo HANA de valor médio K não é suportada.
Propriedades do algoritmo HANA de valor médio K
Tabela 1: Propriedades do algoritmo
Propriedade Descrição
Modo de saída Selecione o modo em que você deseja usar a saída deste algoritmo.
Recursos Selecionar as colunas de entrada com as quais você deseje executar a análise.
Colunas de categorias Selecionar as colunas de entrada, que você deseje considerar como colunas de categorias.
Pesos de categorias Inserir os pesos de categorias.
Calcular silhueta Selecionar essa opção para calcular valores de silhueta. Silhueta significa a qualidade de clustering. O valor 1 de silhueta significa que o clustering é bom enquanto o valor 0 significa que o clustering é ruim.
Valores em falta Selecione o método para manipulação dos valores em falta.
Possíveis métodos:
  • Ignorar: o algoritmo ignora os registros que contêm os valores em falta nas colunas independente ou dependente.
  • Manter: o algoritmo retém o registro que contenha valores em falta durante o cálculo.
Número de clusters Insira o número de grupos para clustering. O valor predeterminado é 5.
Nome do cluster Insira um nome para a coluna recém criada que contenha o nome do cluster.
Distância Insira um nome para a coluna recém-criada que contém a distância dos clusters de seus nomes de centroids.
Iterações máximas Insira o número de iterações permitido para localização de clusters. O valor predeterminado é 100.
Método de cálculo do centro Selecione o método a ser usado para cálculo inicial do centro do cluster.
Medida da distância Insira o método para calcular a distância entre o item e o centro do cluster.
Tipo de normalização Selecione o tipo de normalização.
Número de threads Insira o número de threads a ser usado na execução. O valor predeterminado é 1.
Limite de saída Insira o valor limite para a saída das iterações. O valor predeterminado é 0,000000001.