Clustering

  • Beste Anzahl der Cluster im Bereich finden

Über diese Felder können Sie festlegen, wie viele Cluster durch das Modell generiert werden. Die Anzahl der Cluster ist standardmäßig auf 10 gesetzt. Je höher die Anzahl der Segmente, desto niedriger die Robustheit (Prognosekonfidenz). Je niedriger die Anzahl der Segmente, desto weniger Informationen (prognostische Trennschärfe). Die grundsätzliche Empfehlung lautet, zunächst mit der Standardanzahl zu beginnen und dann, je nach Ergebnissen, die Anzahl der Cluster zu erhöhen oder zu verringern.

  • Für eine überwachte Segmentierung (d.h. mit einem Ziel) wählt der Benutzer die beste Anzahl von Segmenten, z.B. [5;10], was bedeutet, dass vom Benutzer 5 bis 10 Cluster angefordert werden. Die Engine berechnet die "beste Anzahl der Cluster" mithilfe der Metrik "Prognosekonfidenz + prognostische Trennschärfe". Sie können z.B. 7 Cluster haben.
  • Für eine nicht überwachte Segmentierung (d.h. ohne ein Ziel) wählt die Anwendung die minimale Anzahl von Clustern, z.B. [10;10], aus, was bedeutet, dass vom Benutzer 10 Cluster angefordert werden.
Hinweis

Wenn Sie die Option SQL-Ausdrücke berechnen aktivieren, wird ein zusätzlicher Cluster generiert, der die nicht zugeordneten Datensätze enthält.

  • SQL-Ausdrücke berechnen

Mit dieser Funktion können Sie in der Modellauswertung die SQL-Ausdrücke anzeigen, die jeden generierten Cluster definieren. Diese Option ist standardmäßig aktiviert.

  • Erweitert...

Über die Drucktaste Erweitert können Sie auf den Bereich zugreifen. In diesem Bereich können Sie die Kreuzstatistik aktivieren und den Schlüsselwert für jede Zielvariable, die zu verwendende Distanz sowie die Kodierungsstrategie angeben.