Sobald die Datenbeschreibung im Bereich angezeigt wird, wird die Registerkarte Strukturen zur Funktionsleiste hinzugefügt. Dies ermöglicht es Ihnen, die Datenstruktur der Variablen zu bearbeiten.
In der letzten Spalte der Beschreibungstabelle wird der Zustand der Struktur der einzelnen Variablen angegeben. Die folgende Tabelle listet die möglichen Zustände einer Variablenstruktur auf.
| Symbol | Zustand | Beschreibung |
|---|---|---|
![]() |
nicht definiert | Bei der Datenkodierung wird die Gruppierung der Kategorien anhand ihrer Interaktion mit der Zielvariable automatisch ermittelt. |
![]() |
nicht bearbeitbar | Die Struktur für eine ordinale Zeichenfolgenvariable kann nicht verändert werden. |
![]() |
definiert durch Extraktion aus der Variablenstatistik | Der Benutzer muss die Variablenstruktur öffnen und validieren. |
![]() |
definiert durch den Benutzer oder importiert aus einem vorhandenen Modell |
Es gibt verschiedene Möglichkeiten, eine Variablenstruktur zu definieren:
Mithilfe der Option Von K2C ausgeführte, zielbasierte optimale Gruppierung aktivieren kann die Datenkodierung die in der Variablenstruktur definierten Kategoriengruppen gruppieren, wenn sie die gleichen Informationen liefern.
Eine Übersetzung der Variablenkategorien hat keinen Einfluss auf die Variablenstruktur, die gemäß den Originalwerten der Variable festgelegt werden muss.
Extrahieren der Struktur aus Statistik
Extrahieren der Struktur aus Variable
Wenn die Struktur der Variable nicht definiert ist, wird eine Meldung angezeigt.
Importieren der Variablenstruktur aus einem Modell
Erstellen einer neuen Variablenstruktur
(Struktur) für die Variable, für die Sie die Struktur bearbeiten oder anlegen wollen, einen Doppelklick aus. Das Fenster für die Bearbeitung wird geöffnet.Wenn die Struktur aus der Variablenstatistik oder einem Modell extrahiert wurde, sind die Felder bereits ausgefüllt.
Struktur einer Variable entfernen
Da die Struktur einer Variable vom Werttyp der Variable abhängt (nominal, ordinal, continuous) ist der Struktureditor für jeden Typ anders.
Struktur für eine stetige Variable
Die Struktur für eine stetige Variable wird durch mehrere Intervalle definiert, die aus folgenden Elementen bestehen:
Alle Intervalle müssen direkt aneinander angrenzen: Es darf keine Lücke oder Überschneidung zwischen zwei Intervallen geben.
Mit der Option Fehlende hinzufügen können Sie angeben, mit welchen Intervallen die fehlenden Werte gruppiert werden sollen.
Mit der Option Niedrigere Angaben einbeziehen können Sie in das erste Intervall jeden Wert einbeziehen, der kleiner als dessen Untergrenze ist. Auf die gleiche Weise können Sie mit der Option Höhere Angaben einbeziehen in das letzte Intervall jeden Wert einbeziehen, der größer als dessen Obergrenze ist.
Struktur für eine ordinale Variable
Die Struktur für eine ordinale Variable ist der einer stetigen Variable ähnlich, außer dass die Grenzen immer geschlossen sind und nicht verändert werden können.
Die Struktur für eine ordinale Zeichenfolgenvariable kann nicht bearbeitet werden.
Struktur für eine textuelle Variable
Die Struktur für eine textuelle Variable kann nicht bearbeitet werden.
Struktur für eine nominale Variable
Die Struktur für eine nominale Variable besteht aus Gruppen mit den Variablenkategorien.
Wird die Struktur von Ihnen nicht definiert, ermittelt die Anwendung mithilfe von Consistent Coder automatisch die Gruppierung der Kategorien anhand ihrer Interaktion mit der Zielvariable. In diesem Fall können Sie zwei Parameter konfigurieren:
Bereichsanzahl für stetige Variablen
Wenn Sie ohne definierte Struktur arbeiten, können Sie die Bereichsanzahl für stetige Variablen festlegen. Die zulässigen Werte für diesen Parameter liegen zwischen 1 und 20.
Die Population wird auf diese Weise in genau so viele Segmente der gleichen Größe geteilt. Diese Segmente werden für die Erstellung beschreibender Statistiken verwendet, insbesondere die Zielvariablenverteilung für jedes Segment, durch die die Kodierung der Variable im Hinblick auf Zielvariablen beeinflusst wird.
Die Bereichsanzahl beeinflusst die Berechnung der prognostischen Trennschärfe (KI): Je mehr Segmente, desto genauer die Berechnung des KI für die erklärende Variable. Der Einfluss ist jedoch sehr gering.
| Ihr Ziel | Vorgehensweise |
|---|---|
| Sie möchten die Bereichsanzahl für alle stetigen Variablen des Modells anpassen. |
|
| Sie möchten die Bereichsanzahl für die zu bearbeitende Variable anpassen. |
|
Optimale Gruppierung für alle Variablen
Wenn Sie mit einer definierten Struktur arbeiten und Ihre Kategorien so beibehalten möchten, wie Sie für die Modellerstellung definiert sind, müssen Sie diese Option deaktivieren.
Wenn dies nicht der Fall ist oder Sie mit keiner definierten Struktur arbeiten, ermöglicht es Ihnen Optimale Gruppierung für alle Variablen aktivieren in sehr vielen Fällen, die Robustheit des Modells (KR) mit einem minimalen Verlust von Informationen (KI) zu erhöhen. Nach Möglichkeit werden ähnliche benachbarte Segmente gesammelt, um Artefakte zwischen den Schätzungs- und Validierungsdatensets zu reduzieren.