Clustering (SAP-Bibliothek

Clustering

Verwendung

Clustering dient dazu, Daten automatisch zu segmentieren und in so genannte Cluster einzuteilen. In einer ungeordneten Datenmenge ermittelt das System vorher unbekannte Gruppen von zusammengehörigen Daten. Dabei werden sowohl die Kriterien für die Segmentierung, also die Cluster selbst, als auch die jeweils zugeordneten Datensätze ermittelt.

Sie führen die Segmentierung durch Training eines Modells auf Basis von historischen Daten aus. Diese Segmentierung können Sie über eine Vorhersage auf eine andere Datenmenge anwenden.

Beispiel

Ein Getränkehandel für Fruchtsäfte verfügt über Kundendaten, die Attribute wie Geschlecht, Alter, Einkommen, Region, Beruf und meistgekauftes Produkt usw. beinhalten. Das System stellt beim Clustering fest, welche Kombinationen bestimmter Eigenschaften oft zusammen vorkommen und bildet daraus Cluster, d.h. Kundensegmente. Ein Kundensegment könnte zum Beispiel aus Männern zwischen 30 und 40 mit hohem Einkommen bestehen, die am häufigsten Orangensaft kaufen. Ein anderes könnte aus Frauen zwischen 20 und 40 bestehen, die keinen Beruf ausüben und am häufigsten Apfelsaft kaufen.

Integration

Die Daten, auf deren Grundlage Sie das Modell trainieren, können aus beliebigen Systemen stammen, die Daten ins SAP BW extrahieren können. Ebenso können Sie die ermittelte Segmentierung auf alle Daten anwenden, die ins SAP BW extrahiert worden sind.

Voraussetzungen

Ihnen stehen im SAP BW über Queries Daten zur Verfügung, für die die Aussagen bekannt sind, die Sie wiederum für andere Daten herausfinden möchten.

Funktionsumfang

Folgende Einstellungen können Sie in einem Modell zur Methode Clustering vornehmen:

Über die Modellfelder legen Sie fest, welches Merkmal mit welchen Attributen betrachtet werden soll (z.B. Kunde mit den Attributen Beruf, Geschlecht, Alter usw.). In den Feldparametern können Sie unterschiedliche Gewichtungen für die einzelnen Attribute festlegen. Das System ermittelt dann vorher unbekannte Zusammenhänge zwischen den Attributwerten.

Über die Modellparameter können Sie unter anderem festlegen, wie viele Cluster das System beim Training bilden soll. Durch Festlegung von Abbruchbedingungen können Sie die Qualität und die Performance der Segmentierung beeinflussen.

Das System ermittelt beim Training zum einen die Cluster und zum anderen für jeden Merkmalswert (z.B. Kunden), zu welchem Cluster er gehört und wie die Clusterentfernung ist. Das Ergebnis können Sie grafisch anzeigen lassen und in eine Excel-Arbeitsmappe exportieren.

Siehe auch

Modell anlegen, ändern und aktivieren

Analyseprozess für ein Training anlegen

Analyseprozess zum Ausführen der Vorhersage