Show TOC

  Datenarchivierungsprozess (Archiving Workbench)

Einsatzmöglichkeiten

Sie können Daten von Geschäftsobjekten mit dem Datenarchivierungsprozess archivieren. Dieser Prozess wird durch ein dem Geschäftsprozess zugehöriges Archivierungsobjekt implementiert. In diesem Archivierungsobjekt ist der Aufbau und die Zusammensetzung der zu archivierenden Daten festgelegt. Im Rahmen des Datenarchivierungsprozesses repliziert das System die Daten nach verschiedenen Prüfungen auf Archivdateien, liest anschließend die archivierten Daten zur Probe und entfernt sie im Erfolgsfall aus der operativen Datenbank. Neben dem geschilderten Kernprozess gibt es weitere Teilprozesse zur Anzeige und zum Rückladen archivierter Daten sowie zur Paketprofilbildung (Pre-Step).

Voraussetzungen

Sie haben im Einführungsleitfaden bzw. im Bereichsmenü Ihres Anwendungssystems alle erforderlichen Einstellungen vorgenommen:

  1. Anfang des Navigationspfads Archivierung Navigationsschritt Logischen Dateipfad anlegen: Ende des Navigationspfads :

    Der Pfad und die Konvention zur Bildung der Archivdateinamen muss für jedes Archivierungsobjekt über die Grundeinstellungen FILE gepflegt sein (logische Dateipfade und -namen)

  2. Anfang des Navigationspfads Archivierung Navigationsschritt Grundeinstellungen für Archivierungsobjekte pflegen: Ende des Navigationspfads :

    Die Archivierungsobjekte müssen in den Grundeinstellungen AOBJ vollständig gepflegt sein.

  3. Anfang des Navigationspfads Archivierung Navigationsschritt Globale Steuerung der Archivierung pflegen: Ende des Navigationspfads :

    Die Globale Steuerung der Archivierung für alle implementierten Archivierungsobjekte ist gepflegt.

  4. Anfang des Navigationspfads Archivierung Navigationsschritt Archivierungsobjekte Navigationsschritt Residenzzeit für ... definieren: Ende des Navigationspfads :

    Die Residenzzeiten für die Archivierungsobjekte sind im objektspezifischen Customizing gepflegt.

    Hinweis Hinweis

    Zum Überprüfen des Customizing können Sie den Report AFX_ARCHIVING_CUST_CHECK verwenden. Dieser ist Bestandteil des Bereichsmenüs.

    Ende des Hinweises
  5. Anfang des Navigationspfads Werkzeuge Navigationsschritt Parallelisierung Navigationsschritt Jobverteilung pflegen: Ende des Navigationspfads :

    Die Jobverteilung für Parallelisierung für die den Archivierungsobjekten zugeordneten Anwendungsarten ist gepflegt.

Sie haben die Berechtigung zum Durchführen des Archivierungsprozesses: Das System prüft bei allen Aktivitäten das Berechtigungsobjekt S_ARCHIVE . Bei Customizing-Aktivitäten prüft das System das Berechtigungsobjekt S_TABU_DIS .

Ablauf

Sie können den Archivierungsprozess über die normale SAP Jobsteuerung (Transaktion SM36) oder mit Hilfe der Archivadministration (Transaktion SARA) einplanen. Der Archivierungsprozess ist so konzipiert, dass Sie ihn parallel zum operativen Betrieb durchführen können.

Grundsätzlich erfolgt der Archivierungsprozess in den drei Teilprozessen Analyse, Schreiben und Löschen, die durch entsprechende Einstellungen im Customizing miteinander gekoppelt werden können. Die beiden Teilprozesse Analyse und Schreiben werden dabei durch die Nutzung des Parallelisierungstools hochgradig parallelisiert. Dies geschieht durch die Bildung geeigneter Datenpakete, die von verschiedenen Jobs parallel abgearbeitet werden.

Der Pre-Step ist ein optionaler Teilprozess zur Bildung von Paketprofilen, der ggf. vor dem eigentlichen Archivierungsprozess durchlaufen werden muss.

Alle Teilprozesse vermerken ihren aktuellen Ausführungszustand im Aktivitätsprotokoll der Archivierung. Sie können dieses Protokoll und weitere wichtige Informationen (wie beispielsweise das Anwendungs- oder das Job-Protokoll) mit Hilfe des Archivierungsmonitors anzeigen. Weitere Informationen zu diesem Tool der Archiving Workbench finden Sie im Abschnitt Archivierungsmonitor der SAP-Bibliothek.

1. Pre-Step

Der Teilprozess Pre-Step untersucht vorab den Datenbestand des Archivierungsobjekts und generiert entsprechende Paketprofile, welche die Paketgrenzen für die Parallelverarbeitung festlegen. Die Profile werden persistent auf der Datenbank abgelegt und später – falls im globalen Customizing des Archivierungsobjekts eingestellt – von den Teilprozessen Analyse und Schreiben verwendet.

Ziel bei der Paketprofilgenerierung ist es, die in den Teilprozessen Analyse und Schreiben parallel arbeitenden Paketverwalter gleichmäßig auszulasten, um die Gesamtlaufzeit der Archivierung möglichst niedrig zu halten. Hierzu muss der Datenbestand in disjunkte, möglichst gleich große Pakete unterteilt werden. Da sich im Laufe der Zeit die Verteilung der Daten ändern kann, sollten Sie den Pre-Step in regelmäßigen Abständen wiederholen, um das Vorhandensein adäquater Profile zu gewährleisten.

Hinweis Hinweis

Der Pre-Step ist ein optionaler Teilprozess und ist nicht für alle Archivierungsobjekte realisiert.

Ende des Hinweises
2. Analyse

Der Teilprozess Analyse untersucht die Daten eines Archivierungsobjekts und ermittelt den Archivierbarkeitsstatus sowie ggf. das Wiedervorlagedatum . Dazu führt das System grundsätzlich zwei Prüfungen durch:

  • Haben die Daten die im Customizing festgelegten Residenzzeiten (Mindestverweildauer der Daten in der operativen Datenbank) erreicht?

  • Sind alle betriebswirtschaftlichen Aspekte erfüllt, um die Daten zu archivieren?

    Diesen Test führt das System mittels einem Prüfbaustein der Anwendung aus, der ggf. seinerseits über die Verwendung einer Kundenerweiterung (z.B. in Form eines BADIs) auch benutzerdefinierte Prüfungen ermöglichen kann.

Sind beide Prüfungen erfolgreich, setzt das Analyseprogramm den Archivierbarkeitsstatus auf den Wert Archivierbar . Ist mindestens eine der Prüfungen nicht erfolgreich, setzt das Analyseprogramm den Archivierungsstatus auf den Wert Nicht archivierbar und dasWiedervorlagedatum auf den WertSystemdatum + Wiedervorlagezeit.

Die Wiedervorlagezeit bestimmt die Periodizität der Wiedervorlage nach Ablauf der Residenzzeit. Sie legen ihn in der Globalen Steuerung der Archivierung pro Archivierungsobjekt fest. Dadurch wird gewährleistet, dass die Daten erst nach Ablauf des Wiedervorlagezeitraums erneut vom System analysiert werden, was zur Verringerung der zu bearbeitenden Datenmenge und somit zu einer Zeitersparnis bei der Analyse führt.

Zur weiteren Effizienzsteigerung teilt das Analyseprogramm die Daten in disjunkte Pakete auf. Diese Pakete hat es entweder zuvor dynamisch gebildet oder anhand der im Pre-Step-Programm festgelegten Paketprofile ermittelt. Diese Pakete werden anschließend durch voneinander unabhängige Jobs, analysiert. Ein Paket enthält eine durch Schlüsselgrenzen genau definierte Teilmenge der zu verarbeitenden Daten.

Mit dem Start der Parallelverarbeitung geht die Kontrolle an das Parallelisierungstool über. Dieses ruft zur Durchführung der einzelnen Prozessteilschritte Callback-Routinen auf, die von der Archivierung für jede Parallelverarbeitungs-Anwendungsart eines Archivierungsobjektes (d.h. Analyse und Schreiben) zur Verfügung gestellt werden. Die Anzahl der zum Einsatz kommenden Jobs können Sie für jede Anwendungsart im Customizing der Parallelverarbeitung einstellen. Jeder Job verarbeitet verschiedene Pakete, die er nacheinander aus einem von allen Jobs geteilten Arbeitsvorrat entnimmt. Weitere Informationen zur Parallelverarbeitung finden Sie im Abschnitt Parallelverarbeitung von Massendaten (CA-GTF-TS-PPM) der SAP-Bibliothek.

Die folgende Grafik verdeutlicht die durchgeführte Parallelisierung:

Am linken Rand der Grafik sehen Sie die zeitliche Abfolge der Prozessstatus. Weitere Informationen zu diesen Status finden Sie in der Datenelementdokumentation zum Feld Status im Aktivitätsprotokoll. Dieses rufen Sie über den Archivierungsmonitor auf.

3. Schreiben

Das Analyseprogramm startet im Standard automatisch das Schreibprogramm. Das Schreibprogramm repliziert die vom Teilprozess Analyse zuvor als archivierbar gekennzeichneten Daten von der operativen Datenbank in neue Archivdateien. In diesem Schritt findet also die eigentliche Datenarchivierung statt.

Das Schreiben der Daten erfolgt ebenso wie die Analyse parallel in voneinander unabhängigen Jobs (siehe Grafik). Jeder Job verarbeitet verschiedene Teilpakete, die er aus dem gemeinsamen Arbeitsvorrat entnimmt. Pro Job der Parallelverarbeitung wird genau ein Archiv, das aus einer oder mehreren Archivdateien bestehen kann.

4. Löschen

Nach dem Replizieren der Daten auf die Archivdateien werden diese mit Hilfe des Teilprozesses Löschen aus der operativen Datenbank entfernt. Dazu werden die archivierten Daten aus den Archivdateien gelesen und nur bei erfolgreichem Einlesen aus dem Archiv aus der Datenbank gelöscht. Dieses Verfahren garantiert, dass nur solche Daten aus der Datenbank entfernt werden, die das System zuvor ordnungsgemäß archivieren konnte.

Hat der Schreibprozess eine einzelne Archivdatei erfolgreich abgeschlossen, so startet es im Standard automatisch einen separaten Löschprozess. Es entstehen immer genau so viele Löschprozesse wie vom Schreibprogramm Archivdateien angelegt werden.

Falls das Probelesen einer Archivdatei misslingt, bleiben die Daten im operativen System mit dem Status Archivierbar stehen und werden vom Schreibprozess des nächsten Archivierungslaufs erneut verarbeitet. Die bereits angelegten Archivdateien können Sie entweder manuell löschen oder auch auf dem Archiv belassen. Letzteres ist ungefährlich, da auf die Dateien aus dem operativen System heraus nicht verwiesen wird, weil Archivinformationsstrukturen nur beim erfolgreichen Abschluss eines Löschvorgangs angelegt werden.

Ergebnis

Erfolgreicher Abschluss

Nach ordnungsgemäßer Durchführung der Archivierung hat das Schreibprogramm die archivierbaren Daten von der operativen Datenbank in Archivdateien ausgelagert. Sie können mit Hilfe verschiedener Leseprogramme aus dem Archiv zur Anzeige gebracht werden.

Hierzu gibt es folgende Möglichkeiten:

  • Sie integrieren die Anzeige archivierter Daten direkt in die Anwendung.

  • Sie setzen separate Leseprogramme für die Anzeige der Daten ein.

  • Sie nutzen andere Tools, um die Daten anzuzeigen, wie z.B. den Archive File Browser .

Rückladen der Daten

Sie können die archivierten Daten mit Hilfe von Rückladeprogrammen wiederherstellen. Dabei liest das Rückladeprogramm die Daten aus den Archivdateien und fügt sie wieder in die operative Datenbank ein. Dies ist jedoch nur im Notfall (z.B. bei falschen Customizing-Einstellungen, technischen Problemen) erlaubt. Um einen Missbrauch dieser Funktionalität zu vermeiden und die Gefahr möglicher Inkonsistenzen durch Einbringung alter Daten ins operative System zu verringern, können Sie archivierte Daten nur innerhalb einer Frist von fünf Tagen nach erfolgter Archivierung in die operative Datenbank zurückladen. Das Rückladeprogramm setzt das Attribut Archivierbarkeitsstatus der zurückgeladenen Datensätze auf den Wert Nicht archivierbar zurück. Das Wiedervorlagedatum wird nicht angepasst.

Hinweis Hinweis

Beachten Sie, dass jedes Rückladen (auch innerhalb der 5-Tages-Frist) Datenbankinkonsistenzen hervorrufen könnte.

Ende des Hinweises

Hinweis Hinweis

Beachten Sie, dass das Rückladeprogramm Archivinformationsstrukturen (AIS) nicht aktualisiert. Wenn Sie AIS verwenden, müssen Sie nach erfolgtem Rückladen einzelner Archivdateien die Transaktion SARI starten und dann die Daten der AIS für diese Archivdateien abbauen.

Ende des Hinweises

Hinweis Hinweis

Beachten Sie, dass das Analyseprogramm die zurückgeladenen Datensätze mit der nächsten Ausführung erneut als archivierbar kennzeichnet Archivierungslauf erneut in die Archivdatei(en) schreibt. Um dies zu verhindern, müssen Sie ggf. das Customizing der Residenzzeiten des entsprechenden Archivierungsobjekts anpassen.

Ende des Hinweises
Ablage der Archivdateien

Im Allgemeinen genügt es nicht, die zu archivierenden Daten in Archivdateien zu schreiben und aus der Datenbank zu entfernen. Die Archivdateien selbst müssen sicher aufbewahrt und verwaltet werden, um später bei Bedarf darauf zugreifen zu können. Dazu stehen Ihnen folgende Alternativen zur Auswahl:

  • HSM-Systeme (Hierarchical Storage Management)

    Bei einem HSM-System wird ein unendlich großes Dateisystem simuliert. Dazu wird das Dateisystem, in das archiviert wird, in die Speicherhierarchie des HSM-Systems eingebunden. Dafür müssen Sie im Customizing der Archivierung den Dateipfad entsprechend festlegen. Dabei ist die Kommunikation über SAP ArchiveLink nicht notwendig.

  • Ablagesystem über SAP ArchiveLink

    Wenn über SAP ArchiveLink ein Ablagesystem eines Drittanbieters angeschlossen ist, wird dieses Ablagesystem am Ende eines erfolgreich beendeten Löschprogramms beauftragt, die abgearbeitete Archivdatei abzulegen.

  • Manuelle Verwaltung

    Falls Sie die Ablage auf einem Ablagesystem nicht wünschen, können Sie die Archivdateien auch eigenständig verwalten.