Kodierungsstrategie

Die Option Kodierungsstrategie bezieht sich auf die Art der Kodierung, die die Segmentierungs-Engine vom Datenkodierer von Automated Analytics erwartet.

  • Kodierungsstrategie auswählen:
    • Wählen Sie eine der folgenden Optionen in der Dropdown-Liste aus:
Option Beschreibung
Vom System bestimmt Lässt das System die beste Kodierung anhand der Modellparameter auswählen. Die Kodierung Zielmittelwert wird für überwachte Modelle verwendet. Andernfalls werden Variablen mithilfe des Schemas Nicht überwacht kodiert.
Zielmittelwert

Standardwert für überwachte Clusterbildung

Jeder Wert einer stetigen Eingabevariable wird durch den Mittelwert des Ziels für das Segment ersetzt, zu dem der Wert gehört.

Jede Kategorie einer nominalen Eingabevariable wird durch den Mittelwert des Ziels für diese Kategorie ersetzt.

Im Fall einer nominalen Zielvariable entspricht der Mittelwert des Ziels dem Prozentsatz positiver Fälle der Zielvariable für die Eingabevariablenkategorie.

Einheitlich Jedes Variablensegment wird im Bereich [-1;+1] kodiert, sodass die Verteilung der Variablen einheitlich ist.
Nicht überwacht

Standardwert für nicht überwachte Clusterbildung

Eine Strategie ohne Ziel. Zum Kodieren von Variablen wird nur die Segmenthäufigkeit verwendet.

Die folgenden Optionen werden nur angezeigt, wenn alle Variablen stetig sind:

Option Beschreibung
Natürlich Mit dieser Option erfolgt keine Transformation der Eingabedaten.
Min./Max. Mit dieser Option werden die Kategorien der Variable im Bereich [0,1] kodiert, wobei 0 dem Minimalwert der Variable und 1 dem Maximalwert entspricht.
Standardabweichungsnormalisierung

Mit dieser Option wird eine Normalisierung basierend auf dem Variablenmittelwert und der Standardabweichung ausgeführt.