In diesem Bereich können Sie eine Variable als Schätzvariable für die Zielvariable auswählen oder Clusterindizes angeben.
Zielschätzvariable
Eine Zielschätzvariable ist eine Variable, anhand deren das Verhalten der Zielvariable prognostiziert werden kann. Die Verwendung einer Zielschätzvariable ist gleichbedeutend mit dem Anlegen eines Modells.
Wenn Ihr Datenset keine Variable enthält, die als Schätzvariable für das Ziel verwendet werden kann, geben Sie in diesem Bereich keine Daten ein.
Hinweis: Es können nur stetige Variablen als Schätzvariablen verwendet werden.
- Schätzvariable für das Ziel auswählen
- Wählen Sie die Registerkarte Zielschätzvariable.
- Klicken Sie in der Spalte Variablen auf die Variable, die Sie als Schätzvariable verwenden möchten.
- Klicken Sie in der Spalte Ist Schätzvariable für auf die entsprechende Zelle. Es wird eine Liste der verfügbaren Ziele angezeigt.
- Wählen Sie das Ziel aus, das geschätzt werden soll.
Clusterschätzvariable
Wenn Sie ein Datenset verwenden, das aus der Anwendung eines Modells resultiert und das identifizierte Cluster zu jedem Datensatz enthält, können Sie auf dieser Registerkarte die Spalten mit den Clusterindizes angeben. Diese Registerkarte kann hilfreich sein, um Statistiken zu generieren, z.B. zur Größe der einzelnen Cluster und zur Residuenquadratsumme für diese Cluster. Eine typische Verwendungsmöglichkeit besteht darin, mit unterschiedlichen Werkzeugen oder Methoden ermittelte Clustering-Ergebnisse miteinander zu vergleichen.
- Clusterschätzvariable hinzufügen
- Wählen Sie die Registerkarte Clusterschätzvariable.
- Wählen Sie Schätzvariable hinzufügen. Der Liste der Schätzvariablen wird eine Schätzvariable hinzugefügt.
- Klicken Sie auf den Namen der Variable, um die Liste aller nominalen Variablen im Datenset anzuzeigen.
- Wählen Sie in der Liste die Variable aus, die den Clusterindex enthält.
- Wenn das Clustering zum Generieren des Clusterindex im überwachten Modus (d.h. anhand einer Zielvariable) ausgeführt wurde, wählen Sie das Clusterziel aus.
- Wiederholen Sie die Schritte 2 bis 5, wenn mehr als ein Clusterindex vorhanden ist. Wenn das Datenset beispielsweise die Ergebnisse aus zwei verschiedenen Clustering-Werkzeugen enthält, können Sie die entsprechenden Statistiken so direkt innerhalb desselben Datensets vergleichen.
- Wählen Sie in der Liste Distanz unterhalb der Liste mit den Schätzvariablen die Distanz aus, anhand der im ursprünglichen Clustering-Modell die Nähe zweier einzelner Variablen zueinander geschätzt wurde.
- Wählen Sie in der Liste Kodierung unterhalb der Liste mit den Schätzvariablen die Kodierung aus, die im ursprünglichen Clustering-Modell verwendet wurde. Beim Generieren eines Clustering-Modells mit Automated Analytics wird standardmäßig die folgende Kodierung verwendet:
- Zielmittelwert, wenn es sich um ein überwachtes Modell handelt
- andernfalls Nicht überwacht
Hinweis Wenn das Datenset Ergebnisse aus mehreren Modellen enthält, müssen diese unter Verwendung derselben Distanzmetrik und Kodierung generiert worden sein.
- Wenn Sie alle Clusterschätzvariablen angegeben haben, wählen Sie Validieren.
- Clusterschätzvariable entfernen
- Wählen Sie die Schätzvariable aus, die entfernt werden soll.
- Wählen Sie Schätzvariable entfernen.