Die Option Kodierungsstrategie bezieht sich auf die Art der Kodierung, die die Segmentierungs-Engine vom Datenkodierer von Automated Analytics erwartet.
| Option | Beschreibung |
|---|---|
| Vom System bestimmt | Lässt das System die beste Kodierung anhand der Modellparameter auswählen. Die Kodierung Zielmittelwert wird für überwachte Modelle verwendet. Andernfalls werden Variablen mithilfe des Schemas Nicht überwacht kodiert. |
| Zielmittelwert | Standardwert für überwachte Clusterbildung Jeder Wert einer stetigen Eingabevariable wird durch den Mittelwert des Ziels für das Segment ersetzt, zu dem der Wert gehört. Jede Kategorie einer nominalen Eingabevariable wird durch den Mittelwert des Ziels für diese Kategorie ersetzt. Im Fall einer nominalen Zielvariable entspricht der Mittelwert des Ziels dem Prozentsatz positiver Fälle der Zielvariable für die Eingabevariablenkategorie. |
| Einheitlich | Jedes Variablensegment wird im Bereich [-1;+1] kodiert, sodass die Verteilung der Variablen einheitlich ist. |
| Nicht überwacht | Standardwert für nicht überwachte Clusterbildung Eine Strategie ohne Ziel. Zum Kodieren von Variablen wird nur die Segmenthäufigkeit verwendet. |
Die folgenden Optionen werden nur angezeigt, wenn alle Variablen stetig sind:
| Option | Beschreibung |
|---|---|
| Natürlich | Mit dieser Option erfolgt keine Transformation der Eingabedaten. |
| Min./Max. | Mit dieser Option werden die Kategorien der Variable im Bereich [0,1] kodiert, wobei 0 dem Minimalwert der Variable und 1 dem Maximalwert entspricht. |
| Standardabweichungsnormalisierung | Mit dieser Option wird eine Normalisierung basierend auf dem Variablenmittelwert und der Standardabweichung ausgeführt. ![]() |