Die Funktionen von SAP Predictive Analytics machen für die Modellierung zwei obligatorische und ein optionales Teildatenset erforderlich:
- Schätzung: für das Trainieren der Modelle
- Validierung: zur Sicherstellung der Konsistenz oder der Robustheit der Modelle
- Test (optional): zur Berechnung des Qualitätsindikators für das endgültige Modell
Für die Generierung Ihrer Modelle stehen Ihnen neun Unterteilungsstrategien zur Verfügung:
- eine benutzerdefinierte Unterteilungsstrategie, für die jedes Teildatenset explizit festgelegt werden kann
- acht automatische Unterteilungsstrategien:
- Sequenziell: Die Originaldaten sind den Teildatensets in folgendem Verhältnis sequenziell zugeordnet: 3/5 für die Schätzung, 1/5 für die Validierung und 1/5 für den Test. Bei dieser Methode handelt es sich um die schnellste Unterteilungsstrategie.
- Periodisch: Die Originaldaten sind den Teildatensets periodisch in Gruppen von fünf Datensätzen in folgendem Verhältnis zugeordnet: die ersten drei der Schätzung, die vierte der Validierung und die fünfte dem Test. Diese Strategie sollte verwendet werden, wenn die Reihenfolge der Originaldaten ignoriert werden soll.
- Zufall: Die Originaldaten sind den Teildatensets zufällig zugeordnet. Wenn die Daten nach einer Variable, z.B. "Age", oder nach der Zielvariable sortiert sind, ist es empfehlenswert, eine zufällige Unterteilungsstrategie zu verwenden.
- Periodisch mit Test am Ende: Periodische Unterteilungsstrategie mit einem Test am Ende.
- Zufällig mit Test am Ende: Zufällige Unterteilung mit einem Test am Ende.
- Sequenziell ohne Test: Sequenzielle Unterteilungsstrategie, es werden nur die Schätzungs- und Validierungsdatensets verwendet.
- Periodisch ohne Test: Periodische Unterteilungsstrategie, es werden nur die Schätzungs- und Validierungsdatensets verwendet.
- Zufällig ohne Test (Standard): Zufällige Unterteilungsstrategie, es werden nur die Schätzungs- und Validierungsdatensets verwendet.
- Automatische Unterteilungsstrategie auswählen
- Markieren Sie die Option Vordefiniert.
- Wählen Sie in der Liste die zu verwendende Unterteilungsstrategie aus.
- Wählen Sie Weiter. Der Bereich Zu modellierende Daten wird angezeigt.
- Benutzerdefinierte Unterteilungsstrategie auswählen
- Wählen Sie die Option Benutzerdefiniert.
- Wählen Sie über die Drucktaste Durchsuchen für das Feld Schätzung das Datenset aus, das als Schätzungsdatenset verwendet werden soll.
- Wählen Sie über die Drucktaste Durchsuchen für das Feld Validierung das Datenset aus, das als Validierungsdatenset verwendet werden soll.
- Wenn Sie ein Testdatenset verwenden möchten, dann wählen Sie über die Drucktaste Durchsuchen für das Feld Test das zu verwendende Datenset aus. Ansonsten lassen Sie das Feld leer.
- Wählen Sie Weiter. Der Bereich Zu modellierende Daten wird angezeigt.