Effizientes Laden von Daten in Aggregate (SAP-Bibliothek

Effizientes Laden von Daten in Aggregate

Einstellen der automatischen Komprimierung

Sie können für jeden InfoCube einstellen, ob die Aggregate eines InfoCube beim Füllen mit Daten oder nach dem Hochrollen von Datenpaketen (Requests) automatisch komprimiert werden sollen.

...

1. Sie befinden sich im Funktionsbereich Modellierung der Data Warehousing Workbench. Navigieren Sie im InfoProvider-Baum zu dem gewünschten InfoCube.

2. Wählen Sie Administrieren im Kontextmenü des InfoCube.

3. Wählen Sie im unteren Bildbereich die Registerkarte Hochrollen.

4. Setzen Sie unter der Gruppenüberschrift Aggregate das entsprechende Kennzeichen im Feld Nach Hochrollen Komprimieren.

Hinweis

Alternativ können Sie die automatische Komprimierung nach dem Hochrollen auch wie folgt einstellen:

Wählen Sie im Funktionsbereich Modellierung der Data Warehousing Workbench aus dem Kontextmenü zu dem gewünschten InfoCube Anzeigen oder Ändern. Wählen Sie weiter Umfeld ® InfoProvider-Eigenschaften ® Anzeigen bzw. Ändern. Wählen Sie auf der Registerkarte Hochrollen die Option Nach dem Rollup komprimieren.

Kennzeichen

Was Sie wissen sollten

gesetzt (Standard):

automatische Komprimierung eingeschaltet

Die Aggregate eines InfoCube werden beim Füllen mit Daten oder nach dem Hochrollen von Datenpaketen (Requests) automatisch komprimiert.

Wenn ein Datenpaket (Request) aus dem InfoCube gelöscht werden soll, das bereits in die Aggregate hochgerollt worden ist, müssen die Aggregate deaktiviert und neu aufgebaut werden.

nicht gesetzt:

automatische Komprimierung ausgeschaltet

Die Aggregate werden erst zusammen mit dem InfoCube komprimiert.

Verwenden Sie diese Einstellung, wenn Sie häufig Requests aus dem InfoCube löschen müssen. Wenn ein Request aus dem InfoCube gelöscht wird, kann dieser Request auch gezielt aus den Aggregaten gelöscht werden.

Beachten Sie allerdings die möglichen Auswirkungen auf die Performance, da Aggregate, wenn sie nicht automatisch komprimiert werden, recht groß werden können.

Lesen der Daten in Blöcken

Wenn die Datenmenge beim Füllen sehr groß wird, liest das System nicht alle Daten auf einmal, sondern abschnittsweise in Blöcken. Dadurch wird vermieden, dass es bei sehr großen Quellen (InfoCubes oder Aggregaten) zu Schwierigkeiten mit dem temporären Tablespace auf der Datenbank kommt.

Weitere Informationen über die Einstellung der Blockgröße finden Sie im Customizing unter SAP Customizing Einführungsleitfaden ® SAP NetWeaver ® Business Intelligence ® Performance-Einstellungen ® Parameter für Aggregate.

Optimierung der Performance von Aggregaten mit wenigen Merkmalen

Aggregate mit weniger als 14 Merkmalen werden für alle Datenbanken so angelegt, dass jedes Merkmal in einer eigenen (künstlichen) Dimension steht und diese Dimensionen als Line Item Dimensionen angelegt werden. Aggregate, die ausschließlich aus Line Item Dimensionen bestehen, werden mit reinen Datenbankmitteln gefüllt. Das führt zur Verbesserung der Performance beim Füllen und beim Hochrollen.

Die logische Baumdarstellung im rechten Bildbereich des Bildes Pflege der Aggregate wird aus dem linken Bildbereich Vorlage für Aggregate übernommen und spiegelt diese besondere Form des Speicherns auf der Datenbank nicht wider.

Optimierung der Performance des Datenladens

Um die Performance des Datenladens zu optimieren, können Sie festlegen, ob die Indizes vor dem Ladevorgang automatisch gelöscht und nach dem Abschluss des Ladens wieder angelegt werden sollen. Ein solcher Indexaufbau beschleunigt zwar das Laden der Daten, verlangsamt aber die Leseperformance. Daher sollte diese Methode nur dann angewendet werden, wenn während des Datenladens keine Lesevorgänge stattfinden.

Falls Sie dennoch den Indexaufbau beim Hochrollen einschalten möchten, haben Sie folgende Möglichkeiten:

● Wählen Sie im Funktionsbereich Modellierung der Data Warehousing Workbench aus dem Kontextmenü zu dem gewünschten InfoCube Anzeigen oder Ändern. Wählen Sie weiter Umfeld ® InfoProvider-Eigenschaften ® Anzeigen bzw. Ändern. Wählen Sie auf der Registerkarte Datenbank-Performance die Optionen Index vor jedem Datenladen löschen und danach neu aufbauen bzw. Index vor jedem Deltaladen löschen und danach neu aufbauen.

● Wählen Sie im Funktionsbereich Modellierung der Data Warehousing Workbench aus dem Kontextmenü zu dem gewünschten InfoCube Administrieren. Wählen Sie auf der Registerkarte Performance die Option Indexaufbau (batch), und markieren Sie die gewünschten Optionen: Indizes des InfoCubes vor jedem Datenladen löschen und danach neu aufbauen bzw. Auch bei Delta-Upload Indizes löschen und danach neu aufbauen.

Parallele Ausführung von Prozessen für mehrere Aggregate

In der Transaktion zur BI Hintergrundverwaltung (Transaktionscode RSBATCH) können Sie einstellen, dass die folgenden, zur Bearbeitung von Aggregaten gehörenden Prozesse parallel ausgeführt werden. Parallelisiert wird dabei über die Aggregate beliebig vieler InfoCubes.

Prozesstypen für Parallelisierung

Prozesstyp	Beschreibung
AGGRFILL	Initiales Füllen von Aggregaten
ATTRIBCHAN	Attributsänderungslauf
CHECKAGGR	Aggregate prüfen beim Hochrollen
CONDAGGR	Aggregate komprimieren
ROLLUP	Hochrollen

Hinweis

Für das Hochrollen können Sie die Einstellungen auch am InfoCube vornehmen:

Wählen Sie im Funktionsbereich Modellierung der Data Warehousing Workbench aus dem Kontextmenü zu dem gewünschten InfoCube Administrieren. Wählen Sie auf der Registerkarte Hochrollen die Option Diese Grafik wird im zugehörigen Text erklärt Parallelität. Sie gelangen auf ein Dialogfenster zur Festlegung der Einstellungen zur Parallelisierung.

Für den Änderunglauf können Sie die Einstellungen auch im Funktionsbereich Administration der Data Warehousing Workbench unter Änderungslauf vornehmen: Wählen Sie unter der Gruppenüberschrift Ausführen des Änderungslaufs die Option Diese Grafik wird im zugehörigen Text erklärt Parallelität. Sie gelangen auf ein Dialogfenster zur Festlegung der Einstellungen zur Parallelisierung.

Standardmäßig werden maximal drei parallele Prozesse ausgeführt. Diese Einstellung (Anzahl Prozesse) ist für jeden Prozesstyp einzeln einstellbar. Im Zusammenhang mit den Prozessketten kann die getroffene Einstellung an jedem der oben genannten Prozesstypen übersteuert werden.

Achtung

Beachten Sie, dass Füllen, Hochrollen und Änderungslauf aus mehreren Teilprozessen bestehen, die jeweils für sich parallelisiert werden.

Beispiel

So besteht z.B. das Hochrollen aus den folgenden Teilen:

■ Daten in die Aggregate hochrollen

■ zusätzlich ggf. Komprimieren

■ zusätzlich ggf. auf Korrektheit prüfen

Die Einstellungen für die Parallelisierung bei den Teilaufgaben entsprechen denen für den Hauptjob. Wenn Sie z.B. eingestellt haben, dass das Hochrollen fünffach parallel und das Komprimieren zweifach parallel ausgeführt werden soll, wird das Komprimieren im Zusammenhang mit dem Hochrollen fünffach parallel ausgeführt.

Empfehlung

Falls dieses Verhalten nicht gewünscht wird, können Sie die Parametrisierung am InfoCube so einstellen, dass die Aggregate nicht automatisch komprimiert werden (siehe oben den Abschnitt Einstellen der automatischen Komprimierung). Zusätzlich können Sie dann in der Prozesskette dem Prozess des Hochrollens den Prozess Aggregate komprimieren folgen lassen. In diesem Fall werden diejenigen Einstellungen für das Komprimieren angewendet, die Sie in der Transaktion zur BI Hintergrundverwaltung (Transaktionscode RSBATCH) eingestellt haben; in unserem Beispiel also fünffach für das Hochrollen und zweifach für das Komprimieren.

Die parallelen Prozesse werden stets im Hintergrund ausgeführt, auch wenn der Hauptprozess im Dialog ausgeführt wird. Hierdurch kann die Ausführungszeit für diese Prozesse deutlich verkürzt werden. Sie können den Parallelisierungsgrad bestimmen und festlegen, auf welchen Servern die Prozesse mit welcher Priorität (d.h. mit welcher Jobklasse) laufen sollen. Dabei hat die Jobklasse ’A’ die höchste Priorität, gefolgt von ’B’ und schließlich ’C’.

Achtung

Beachten Sie, dass ein Parallelisierungsgrad (Anzahl Prozesse) von mehr als 2 bedeutet, dass ein Prozess die anderen Prozesse überwacht und die Arbeitspakete einteilt. Somit ist stets ein Prozess weniger als eingestellt an der eigentlichen Abarbeitung beteiligt.