Unterteilungsstrategie

Die Funktionen von SAP Predictive Analytics machen für die Modellierung zwei obligatorische und ein optionales Teildatenset erforderlich:

  • Schätzung: für das Trainieren der Modelle
  • Validierung: zur Sicherstellung der Konsistenz oder der Robustheit der Modelle
  • Test (optional): zur Berechnung des Qualitätsindikators für das endgültige Modell

Für die Generierung Ihrer Modelle stehen Ihnen neun Unterteilungsstrategien zur Verfügung:

  • eine benutzerdefinierte Unterteilungsstrategie, für die jedes Teildatenset explizit festgelegt werden kann
  • acht automatische Unterteilungsstrategien:
    • Sequenziell: Die Originaldaten sind den Teildatensets in folgendem Verhältnis sequenziell zugeordnet: 3/5 für die Schätzung, 1/5 für die Validierung und 1/5 für den Test. Bei dieser Methode handelt es sich um die schnellste Unterteilungsstrategie.
    • Periodisch: Die Originaldaten sind den Teildatensets periodisch in Gruppen von fünf Datensätzen in folgendem Verhältnis zugeordnet: die ersten drei der Schätzung, die vierte der Validierung und die fünfte dem Test. Diese Strategie sollte verwendet werden, wenn die Reihenfolge der Originaldaten ignoriert werden soll.
    • Zufall: Die Originaldaten sind den Teildatensets zufällig zugeordnet. Wenn die Daten nach einer Variable, z.B. "Age", oder nach der Zielvariable sortiert sind, ist es empfehlenswert, eine zufällige Unterteilungsstrategie zu verwenden.
    • Periodisch mit Test am Ende: Periodische Unterteilungsstrategie mit einem Test am Ende.
    • Zufällig mit Test am Ende: Zufällige Unterteilung mit einem Test am Ende.
    • Sequenziell ohne Test: Sequenzielle Unterteilungsstrategie, es werden nur die Schätzungs- und Validierungsdatensets verwendet.
    • Periodisch ohne Test: Periodische Unterteilungsstrategie, es werden nur die Schätzungs- und Validierungsdatensets verwendet.
    • Zufällig ohne Test (Standard): Zufällige Unterteilungsstrategie, es werden nur die Schätzungs- und Validierungsdatensets verwendet.
  • Automatische Unterteilungsstrategie auswählen
    1. Markieren Sie die Option Vordefiniert.
    2. Wählen Sie in der Liste die zu verwendende Unterteilungsstrategie aus.
    3. Wählen Sie Weiter. Der Bereich Zu modellierende Daten wird angezeigt.
  • Benutzerdefinierte Unterteilungsstrategie auswählen
    1. Wählen Sie die Option Benutzerdefiniert.
    2. Wählen Sie über die Drucktaste Durchsuchen für das Feld Schätzung das Datenset aus, das als Schätzungsdatenset verwendet werden soll.
    3. Wählen Sie über die Drucktaste Durchsuchen für das Feld Validierung das Datenset aus, das als Validierungsdatenset verwendet werden soll.
    4. Wenn Sie ein Testdatenset verwenden möchten, dann wählen Sie über die Drucktaste Durchsuchen für das Feld Test das zu verwendende Datenset aus. Ansonsten lassen Sie das Feld leer.
    5. Wählen Sie Weiter. Der Bereich Zu modellierende Daten wird angezeigt.