Neue Normalisierung

Die Normalisierung ist ein Standardprimitiv für analytische Datensets, das in PMML (Predictive Model Markup Language), einer von der Data Mining Group (DMG) definierten Spezifikationssprache für das Data Mining, verwendet wird. Die Normalisierung wird häufig vor dem Data Mining auf numerische Variablen angewendet, und sie besteht aus einer stückweisen linearen Transformation, deren resultierende Variable in der Regel einen Wert von 0 bis 1 aufweist. Sie kann für Rangtransformationen verwendet werden, bei denen der Ausgabewert die Menge in Bezug auf den angenäherten Anteil (das Perzentil) der Werte unterhalb des Eingabewertes darstellt. Alternativ kann ein Feld basierend auf der Anzahl der Standardabweichungen, die ein Wert vom Mittelwert des Feldes entfernt ist, konvertiert werden. Ein weiterer Bestandteil der Normalisierung ist die Spezifizierung des Wertes, der zu verwenden ist, wenn ein numerischer Eingabewert unbekannt ist oder sich außerhalb des in den Trainingsdaten sichtbaren Bereichs befindet.

  • Neue Normalisierung anlegen
    1. Wählen Sie ein Feld in der Liste Zu normalisierendes Feld auswählen aus. Es werden nur Zahlen- oder Ganzzahlenfelder angezeigt.
    2. Führen Sie für jeden Punkt in der Normalisierung folgende Aktionen aus:
      1. Geben Sie im Abschnitt Punkte zur Normalisierung hinzufügen im Feld Eingabe einen Wert ein.
      2. Geben Sie im Feld Ausgabe den entsprechenden Ausgabewert ein.
      3. Wählen Sie die Drucktaste +, um den definierten Punkt zu der Normalisierung hinzuzufügen. Der Punkt wird in der Liste angezeigt.

        Wenn mindestens zwei Punkte definiert wurden, wird im Abschnitt Übersicht unten im Bereich das entsprechende Diagramm angezeigt.

    3. Wählen Sie in der Liste Minimalwerte im Abschnitt Verhalten bei Werten außerhalb des Bereichs definieren das Verhalten aus, das auf Werte angewendet werden soll, die unterhalb des niedrigsten der zuvor festgelegten Punkte liegen. Die verfügbaren Werte sind in der folgenden Tabelle beschrieben:
      Verhalten: Die Werte außerhalb des Bereichs entsprechen: Diagramm:
      Sättigung dem Wert der Bereichsgrenzen BILD HIER
      Steigung der Fortsetzung ins Unendliche der zur letzten Grenze führenden geraden Linie BILD HIER
      Benutzerdefiniert

      einem benutzerdefinierten Wert.

      Um einen benutzerdefinierten Wert festzulegen, geben Sie den Wert im Textfeld ein und wählen "Aktualisieren", um das Diagramm zu aktualisieren.

      BILD HIER
      Leerwert dem Nullwert. Das heißt, dass diese Werte im Diagramm nicht angezeigt werden. BILD HIER
    4. Wählen Sie Weiter. Das Popup Geben Sie den Namen des berechneten Feldes ein wird geöffnet.
    5. Geben Sie im Feld Name den neuen Feldnamen ein.
      Hinweis

      Wenn Sie einen bereits vorhandenen Namen eingeben, wird eine entsprechende Meldung angezeigt, und die Drucktaste OK wird deaktiviert.

    6. Wählen Sie OK. Die Liste Felder wird angezeigt. Sie enthält das neu angelegte Feld.