Die Normalisierung ist ein Standardprimitiv für analytische Datensets, das in PMML (Predictive Model Markup Language), einer von der Data Mining Group (DMG) definierten Spezifikationssprache für das Data Mining, verwendet wird. Die Normalisierung wird häufig vor dem Data Mining auf numerische Variablen angewendet, und sie besteht aus einer stückweisen linearen Transformation, deren resultierende Variable in der Regel einen Wert von 0 bis 1 aufweist. Sie kann für Rangtransformationen verwendet werden, bei denen der Ausgabewert die Menge in Bezug auf den angenäherten Anteil (das Perzentil) der Werte unterhalb des Eingabewertes darstellt. Alternativ kann ein Feld basierend auf der Anzahl der Standardabweichungen, die ein Wert vom Mittelwert des Feldes entfernt ist, konvertiert werden. Ein weiterer Bestandteil der Normalisierung ist die Spezifizierung des Wertes, der zu verwenden ist, wenn ein numerischer Eingabewert unbekannt ist oder sich außerhalb des in den Trainingsdaten sichtbaren Bereichs befindet.
Wenn mindestens zwei Punkte definiert wurden, wird im Abschnitt Übersicht unten im Bereich das entsprechende Diagramm angezeigt.
| Verhalten: | Die Werte außerhalb des Bereichs entsprechen: | Diagramm: |
|---|---|---|
| Sättigung | dem Wert der Bereichsgrenzen | BILD HIER |
| Steigung | der Fortsetzung ins Unendliche der zur letzten Grenze führenden geraden Linie | BILD HIER |
| Benutzerdefiniert | einem benutzerdefinierten Wert. Um einen benutzerdefinierten Wert festzulegen, geben Sie den Wert im Textfeld ein und wählen "Aktualisieren", um das Diagramm zu aktualisieren. |
BILD HIER |
| Leerwert | dem Nullwert. Das heißt, dass diese Werte im Diagramm nicht angezeigt werden. | BILD HIER |
Wenn Sie einen bereits vorhandenen Namen eingeben, wird eine entsprechende Meldung angezeigt, und die Drucktaste OK wird deaktiviert.