Mapas de organización propia de HANA

Propiedades que se pueden configurar para el algoritmo Mapas de organización propia de HANA.

Sintaxis

Un mapa de organización propia (SOM) o un mapa de función de organización propia (SOFM) es un tipo de red neuronal artificial formada con aprendizaje no supervisado para producir una representación discretizada de bajas dimensiones (normalmente de dos dimensiones) del espacio de entrada de las muestras de formación, denominado mapa. Estos mapas de organización propia se diferencian de otras redes neuronales en que utilizan una función de vecindario para conservar las propiedades topológicas del espacio de entrada.

Por este motivo, los SOMs resultan útiles para las vistas de pocas dimensiones de datos de muchas dimensiones, de forma similar a la escala multidimensional. El profesor finlandés Teuvo Kohonen fue el primero en describir este modelo como una red neuronal artificial y en ocasiones se denomina mapa Kohonen. Al igual que la mayoría de redes neuronales artificiales, los SOMs funcionan en dos modos: formación y creación de mapas. La formación crea el mapa con ejemplos de entrada, un proceso competitivo que también se denomina cuantificación de vectores. La creación de mapas clasifica automáticamente un nuevo vector de entrada.

El alcance de los SOM tiene diversas aplicaciones, como la virtualización, la agrupación en clúster de documentos web y el reconocimiento por voz.

Propiedades de los mapas de organización propia de HANA
Tabla 1: Propiedades del algoritmo
Propiedad Descripción
Altura del mapa Introduzca una altura para el mapa. El valor predeterminado es 5.
Anchura del mapa Introduzca una anchura para el mapa. El valor predeterminado es 5.
Alfa Introduzca el valor para la tasa de aprendizaje. El valor predeterminado es 0,5.
Forma del mapa Seleccione la forma para el mapa.
Características Seleccione las columnas de entrada con las que desea realizar la regresión.
Calcular silueta Seleccione esta opción para calcular valores de silueta. La silueta significa la calidad de la agrupación en clúster. El valor de silueta 1 significa que la agrupación en clúster es buena y 0 significa que es mala.
Nombre de clúster Introduzca un nombre para la nueva columna que contiene los números de clúster para el conjunto de datos indicado.
Valores faltantes Seleccione el método para manejar los valores perdidos.
Métodos posibles:
  • Omitir: el algoritmo omite los registros que contienen valores faltantes en las columnas independientes o dependientes.
  • Conservar: el algoritmo conserva el registro que contiene los valores faltantes durante el cálculo.
Tipo de normalización Seleccione el tipo de normalización.
Tipos posibles:
  • No es necesaria la normalización
  • Nueva normalización de rangos
  • Normalización del resultado cero:
Muestreo aleatorio Introduzca el muestreo aleatorio que desee utilizar para realizar el cálculo. Si introduce -1, el algoritmo selecciona por sí solo un número aleatorio para el cálculo. El valor predeterminado es -1.
Repeticiones máximas Introduzca la cantidad de repeticiones que desea que el algoritmo utilice para buscar clústeres. El valor predeterminado es 100.
Número de subprocesos Escriba el número de subprocesos que debe usar el algoritmo durante la ejecución. El valor predeterminado es 2.