Ansichten

Der Bereich Ansichten ermöglicht es Ihnen, die Daten und den generierten SQL-Code anzuzeigen, um die Optionen festzulegen.

Felder

Auf dieser Registerkarte wird die Quelltabelle vorhandener Felder angezeigt, und Sie können eigene Felder hinzufügen.

Folgende Operationen sind zu vorhandenen Feldern verfügbar:

  • Ändern Sie einen Feldalias.
  • Legen Sie eine Feldsichtbarkeit fest, d. h., entscheiden Sie, ob das Feld zum analytischen Datenset hinzugefügt wird. Felder, die als nicht sichtbar eingerichtet sind, werden auf der Registerkarte Daten anzeigen nicht angezeigt, können aber beispielsweise zum Zusammenführen oder Filtern verwendet werden.
  • Fügen Sie einem Feld eine Beschreibung hinzu.
  • Bearbeiten Sie Feldinformationen (nur für berechnete Felder, die vom Benutzer angelegt wurden).

Beim Anlegen eines neuen berechneten Feldes stehen Ihnen folgende Typen zur Auswahl:

  • Funktion, wie mathematische Operatoren, logische Operatoren, Zeichenfolgenmanipulationen, mathematische Funktionen und Datumsmanipulationen.
  • Aggregat ermöglicht Ihnen, Referenzinformationen aus einer Tabelle und Informationen aus einer Verlaufstabelle zusammenzuführen, die automatisch pro Zeitperiode aggregiert wird.
  • Veränderliches Aggregat, d. h. ein Aggregat, das innerhalb eines Zeitraums wiederholt werden kann.
  • Bedingung, wie "Start with", "Greater than", "Not", "Is Null", "Is in Range", ...
  • Die Lookup-Tabelle ist ein Dictionary, mit dem Werte aus Identifikatoren in Zeichenfolgen übersetzt bzw. Werte, die geringe Unterschiede aufweisen, in einer kleineren Anzahl allgemeinerer Selektionsgrade zusammengefasst werden.
  • Normalisierung, d. h. eine stückweise lineare Transformation, deren resultierende Variable in der Regel einen Wert von 0 bis 1 aufweist.
  • SQL-Ausdruck, d. h. ein vom Benutzer definierter SQL-Ausdruck.
  • Freier Ausdruck, d. h. ein vom Benutzer definierter logischer Ausdruck.
  • Neues berechnetes Feld anlegen
    1. Wählen Sie + Neu.
    2. Wählen Sie den anzulegenden Feldtyp aus.
    3. Je nach dem ausgewählten Feldtyp legen Sie die Feldparameter fest. Das angelegte Feld wird in der Liste zusammen mit den ursprünglichen Quellfeldern angezeigt.
Daten und Statistik

Diese Option zeigt die aus der Datenbank extrahierten Daten an, wenn dieses analytische Datenset ausgeführt wird. Zudem liefert sie Statistiken zu diesen Daten. Die Option ermöglicht es Ihnen, zu prüfen, ob die Ergebnisse dem entsprechen, was Sie erwarten.

Sie können die Tabelle sortieren, indem Sie auf den Kopf der entsprechenden Spalte klicken.

Generierter SQL-Code

Auf dieser Registerkarte wird die SQL-Abfrage angezeigt, die zu dem angelegten analytischen Datenset gehört.

Dokumentation

Auf der Registerkarte Dokumentation können Sie sich einen Überblick über das analytische Datenset verschaffen. Hier sind alle für das analytische Datenset ausgewählten Optionen enthalten, z.B. Filter, Zusammenführen, Aufforderungen oder Ausdrücke.

In diesem Bild wird Folgendes angezeigt:

  • Grafikübersicht
  • Sichtbare/Nicht sichtbare Felder
  • Aufforderung
  • Ausdrücke
  • Filter

In der Grafikübersicht wird Folgendes angezeigt:

  • Die Liste der im analytischen Datenset enthaltenen Tabellen und deren Verarbeitung – z. B. durch Zusammenführung oder Aggregate.
  • Die für das analytische Datenset beibehaltenen Felder, die sogenannten sichtbaren Felder.

"Sichtbare Felder" zeigt in einer Tabelle die Sortierungsspalten der sichtbaren Felder an, usw.

Diese Übersicht kann mit der Option "Einstellungen" angepasst werden:

  • Abschnittseinstellungen
  • Feldeinstellungen

In den Übersichtseinstellungen können Sie entscheiden, wie die Übersicht sowohl für die Anzeige als auch den Export formatiert wird . Die generierte Datei kann in den Dateiformaten .txt, .htm und .rtf gesichert werden.

Info

Mit der Drucktaste Info können Sie technische Informationen zur Datenbank anzeigen, in der sich Ihre Daten befinden. Es werden die folgenden Informationen bereitgestellt:

  • Datenbankname, Version und Treiberversion
  • maximal unterstützte Länge für Tabellen und Spaltennamen
  • maximal unterstützte Anzahl an Spalten in Tabellen und Abfragen
  • maximal unterstützte Länge für eine Abfrage
  • maximal unterstützte Anzahl an Spalten in einer Abfrage
Optionen
Optionen Beschreibung Werte/Standard
Ausdrücke mit mehreren Referenzen optimieren

Bei einem analytischen Datenset können zwei Strategien eingesetzt werden, wenn ein berechnetes Feld bzw. ein Ausdruck mehr als einmal referenziert wird:

  • Die Standardstrategie, wobei jede Referenz durch die vollständige SQL-Definition des betreffenden berechneten Felds ersetzt wird, sodass die Berechnung mehrmals durchgeführt wird.
  • Die optimierte Strategie, wobei eine temporäre Spalte (einmal) mithilfe des SQL-Definitionsfeldes berechnet wird. Jede weitere Referenz zu dem berechneten Feld wird durch eine Referenz auf die neue Spalte ersetzt.

Auto (Standard): Die Strategie wird vom System automatisch ausgewählt. Wenn ein Feld mehr als einmal referenziert wird, wird standardmäßig die optimierte Strategie verwendet.

Aktiviert: Die optimierte Strategie wird verwendet.

Deaktiviert: Die Standardstrategie wird verwendet.

Maximale Anzahl der Ausdruckswiederverwendungen vor der Optimierung

Wenn die Option "Ausdrücke mit mehreren Referenzen optimieren" aktiviert ist, können Sie angeben, wie oft ein Feld bzw. ein Ausdruck referenziert werden muss, bevor die optimierte Strategie verwendet wird.

Standardmäßig liegt die Schwelle bei 2, d. h., wenn das Feld mehr als einmal referenziert wird, wird die optimierte Strategie angewendet.
Mehrere Abfragen generieren

Mit dieser Option kann die Aufteilung von analytischen Datensets in kleinere Zwischenschritte (automatisch vom System festegelegt) erzwungen oder deaktiviert werden.

Auto (Standard): Je nach der relativen Komplexität des analytischen Datensets, entscheidet das System, ob die Aufteilung aktiviert wird.

Aktiviert: Das analytische Datenset wird ungeachtet seiner Komplexität in Zwischenschritte aufgeteilt.

Deaktiviert: Das analytische Datenset wird nie in Zwischenschritte aufgeteilt, unabhängig davon, wie komplex es ist. Dieser Wert sollte nur mit größter Sorgfalt ausgewählt werden.

Standardaggregate als korrelierte Tabellen generieren Mit dieser Option kann die Generierung von Standardaggregaten erzwungen oder deaktiviert werden (min, max, count, avg), wobei korrelierte Tabellen anstatt von SELECT-Unterabfragen verwendet werden.

Auto (Standard): Das System wählt automatisch aus, welche Art von Aggregatgenerierung eingesetzt wird.

Aktiviert: Wenn es das RDBMS erlaubt, werden korrelierte Tabellen generiert.

Deaktivieren: Wenn es das RDBMS erlaubt, werden Unterabfragen generiert.

Bei einigen Datenbanken werden diese Optionen ignoriert, wenn nur eine der beiden Formen unterstützt wird. MySQL unterstützt beispielsweise nur SELECT-Unterabfragen, Teradata hingegen nur korrelierte Tabellen.

Eine Liste der Datenbanken, die die jeweilige Form unterstützen, finden Sie im Abschnitt "Unterstützte Aggregat-SQL-Formen" (auf Seite 75).

Aggregate mit der Bezeichnung "First/Last" als korrelierte Tabellen generieren Mit dieser Option kann die Generierung des Aggregats First/Last mithilfe korrelierter Tabellen anstelle von SELECT-Unterabfragen erzwungen bzw. deaktiviert werden.
Aggregate mit der Bezeichnung "Exists" als korrelierte Tabellen generieren Mit dieser Option kann die Generierung der Aggregate Exists mithilfe korrelierter Tabellen anstatt von SELECT-Unterabfragen erzwungen bzw. deaktiviert werden.
Nach jeder Abfrage Zusammenführungsbedingungen generieren

Aus Gründen der Deutlichkeit steht die Bezeichnung (T1,T2) für die Operation der (äußeren linken) Verknüpfung von T1 und T2 zu einer bestimmten Bedingung.

In einer langen Kette/Sequenz von Tabellenverknüpfungen, z. B. ((T1,(T2,T4)), (T3,T4)), können einige der Verknüpfungsbedingungen gleich nach der Verknüpfung oder am Ende der Abfrage ohne Auswirkung auf den resultierenden Zeilensatz generiert werden. In einigen Fällen werden endpositionierte Verküpfungsbedingungen die Performance der generierten SQL negativ beeinflussen. Mit dieser Option kann die Position von Verknüpfungsbedingungen festgelegt werden.

Auto (Standard): Die bevorzugte Form wird vom System automatisch entsprechend der Experimente zu der betreffenden Datenbank ausgewählt.

Aktiviert: Die Verknüpfungsbedingungen werden gleich nach der Verknüpfungsoperation generiert.

Deaktiviert: Die Verknüpfungsbedingungen werden am "Ende" der Verknüpfungskette generiert.

Populationen mit Zeitstempel materialisieren In der operativen Umgebung generieren analytische Automated-Analytics-Datensets kompliziertes SQL, das eventuell von manchen RDBMS-Optimierern nicht korrekt analysiert wird. Das konnte besonders beobachtet werden, wenn gefilterte Populationen mit Zeitstempel beteiligt sind. Um dies zu umgehen, ist es hilfreich, die Population mit Zeitstempel zu materialisieren, damit der Optimierer bessere Entscheidungen für den Ausführungsplan treffen kann. Mit dieser Option kann dieses Verhalten besser gesteuert werden.

Auto (Standard): Das System verwendet bestimmte Regeln, um automatisch zu entscheiden, ob die Materialisierung angewendet werden soll. Zunächst werden alle gefilterten Populationen mit Zeitstempel materialisiert.

Aktiviert: Alle Populationen mit Zeitstempel werden materialisiert.

Deaktiviert: Populationen mit Zeitstempel werden nie materialisiert.

Pivotierte Aggregate gruppieren (nach Pivotwert)

Bei Datenbanken, wie Teradata, Oracle und DB2, werden Aggregate als korrelierte oder abgeleitete Tabellenausdrücke formuliert. In jeder dieser Tabellen werden Aggregate gesammelt, die über denselben Zeilensatz generiert werden. Ein Zeilensatz wird einerseits nach den Schlüsselspalten und andererseits nach der Filterbedingung definiert. Im Filter ist die Zeitfensterspezifikation (sofern vorhanden) zusammen mit einem zusätzlichen Prädikat eingebettet.

Mit dieser Option kann dieses Prädikat so generiert werden, dass es berücksichtigt wird, ohne die Filterbedingung negativ zu beeinflussen. D.h., zueinander in Beziehung stehende pivotierte Aggregate werden in unterschiedlichen Tabellen generiert.

Auto (Standard): Das System entscheidet anhand der Anzahl der in Beziehung stehenden Aggregate, ob der Filterbedingung das zusätzliche Prädikat hinzugefügt wird. Der entsprechende Wert kann über die Option "Maximale Anzahl der Wiederverwendungen der Pivotierungsbedingung vor Gruppierung" festgelegt werden.

Aktiviert: Das zusätzliche Prädikat ist nie Teil des Filterausdrucks.

Deaktiviert: Das zusätzliche Prädikat ist immer Teil des Filterausdrucks.

Maximale Anzahl der Wiederverwendungen der Pivotierungsbedingung vor Gruppierung Wenn für die Option "Pivotierte Aggregate gruppieren (nach Pivotwert)" die Auswahl "Auto" festgelegt wurde, werden die Aggregate, die das gleiche Zeitfenster teilen, aber unterschiedliche zusätzliche Filterbedingungen ergeben, in einer Gruppe zusammengeführt, sofern ihre Anzahl einen vorgegebenen Schwellenwert übersteigt. Mit dieser Option wird diese Schwelle eingestellt. Standardmäßig ist für diesen Wert 5 eingestellt.
Anzahl der pivotierten Aggregate pro Gruppierung Wenn für die Option "Pivotierte Aggregate gruppieren (nach Pivotwert)" die Auswahl "Auto" festgelegt wurde, werden die Aggregate, die dasselbe Zeitfenster teilen, aber unterschiedliche zusätzliche Filterbedingungen ergeben, in einer Gruppe zusammengeführt. Mit diesem Parameter kann die maximale Anzahl der Aggregate festgelegt werden, die in einer Gruppe vorhanden sein dürfen. Standardmäßig ist für diesen Wert 7 eingestellt.
Aggregate vorfiltern

Die Tabellenausdrücke, mit denen pivotierte Aggregate gruppiert werden, bieten die Möglichkeit, die von diesen Aggregaten gesehenen Zeilen zu filtern.

Beim Vorfiltern sind oft Spalten ohne Index beteiligt, was folglich zu umfassenden Scans führt. Wenn alle in den Aggregatfiltern oder Verknüpfungsbedingungen verwendeten Spalten bekannterweise indiziert sind, kann eine Vorfilterung positive Auswirkungen auf die Peformance haben.

Da jedes Aggregat nur die übereinstimmenden Zeilen verarbeitet, kann diese Vorfilterung ausgelassen werden.

Diese Option ist standardmäßig deaktiviert.
Immer sichtbare Felder Analytische Datenobjekte, wie Entitäten oder Populationen mit Zeitstempel, werden konfiguriert, damit nur ein bestimmter Satz Felder angezeigt wird. Mit dieser Option können Sie andere Felder als sichtbar einstellen, sodass sie Benutzern analytischer Datensets angezeigt werden.

Standardmäßig werden die Felder KxTarget und KxWeight aufgeführt.

Um weitere Felder hinzuzufügen, geben Sie deren Namen durch ein Semikolon getrennt ein.

Konstantenfelder durch Werte ersetzen Wenn ein analytisches Datenset ein Feld mit einem konstanten Wert anzeigen soll, wird der tatsächliche Wert zu Optimierungszwecken nach oben propagiert. Die oberen analytischen Datensets werden darüber informiert, dass das betreffende Feld konstant ist und sein Wert daher an allen Stellen verwendet werden muss, an denen der Feldname referenziert wird. Dadurch können analytische Datensets 10 Mal schneller ausgeführt werden. Diese Option ist standardmäßig aktiviert. Um sie zu deaktivieren, entmarkieren Sie das Ankreuzfeld.
Ausdrücke basierend auf Feldern für analytische Teildatensets optimieren

In einem analytischen Datenset werden mehrmals referenzierte Ausdrücke aus Effizienzgründen faktorisiert. Falls bei diesen Ausdrücken einige Felder aus einem verknüpften Datenset bzw. analytischen Teildatenset stammen, ist das System eventuell nicht in der Lage, diese zu faktorisieren. In diesem Fall ist es mit dieser Option möglich, solche Ausdrücke aus dem Faktorisierungsprozess (auch Optimierungsprozess genannt) auszuschließen.

Beachten Sie, dass diese Option von den Optionen "Ausdrücke mit mehreren Referenzen optimieren" und "Maximale Anzahl der Ausdruckswiederverwendungen vor der Optimierung" abhängt.

Diese Option ist standardmäßig deaktiviert. Um sie zu aktivieren, markieren Sie das Ankreuzfeld.
Schlüssel ohne Join nicht aus Zwischenoptimierungen ausschließen

Zu Optimierungszwecken findet die Faktorisierung von Ausdrücken mit mehreren Referenzen nur statt, wenn die zur Berechnung verwendete Tabelle über Schlüsselspalten verfügt.

Um bei analytischen Datensets mit mehreren Schritten einen Verstoß gegen Gültigkeits- und Eindeutigkeitsbeschränkungen physischer Schlüssel zu vermeiden, wendet das System bestimmte Regeln an, um nicht erforderliche Schlüssel in Zwischentabellen herauszufiltern. Das kann dazu führen, dass Ausdrücke mit mehreren Referenzen nicht faktorisiert werden.

Mit dieser Option wird das System angewiesen, Schlüsselspalten, die im Optimierungsprozess benötigt werden, nicht aus Zwischentabellen auszuschließen.

Diese Option ist standardmäßig aktiviert. Um sie zu deaktivieren, entmarkieren Sie das Ankreuzfeld.
Unterstützte Aggregat-SQL-Formen
Standard First/Last Exists
Access Nur Unterabfrage Nur Unterabfrage Nur Unterabfrage
SQLServer Korrelierte Tabellen als Standard Korrelierte Tabellen als Standard Nur Unterabfrage
Oracle Korrelierte Tabellen als Standard Nur korrelierte Tabellen Nur Unterabfrage
Teradata Nur korrelierte Tabellen Nur korrelierte Tabellen Nur korrelierte Tabellen
DB2 Nur Unterabfrage Nur korrelierte Tabellen Nur Unterabfrage
MySQL Nur Unterabfrage Nur Unterabfrage Nur Unterabfrage
PostgreSQL Korrelierte Tabellen als Standard Nur korrelierte Tabellen Nur korrelierte Tabellen
SybaseIQ Nur korrelierte Tabellen Nur korrelierte Tabellen Nur korrelierte Tabellen
Vertica Nur korrelierte Tabellen Nur korrelierte Tabellen Nur korrelierte Tabellen
Netezza Nur korrelierte Tabellen Korrelierte Tabellen als Standard Korrelierte Tabellen als Standard

Beschriftung:

  • Nur Unterabfrage: Zu dieser Datenbank werden Aggregate nur mit dem Unterabfrageformular generiert.
  • Nur korrelierte Tabellen: Zu dieser Datenbank werden Aggregate nur mit korrelierten Tabellen generiert.
  • Korrelierte Tabellen als Standard: Zu dieser Datenbank werden standardmäßig korrelierte Tabellen generiert, eine Generierung von SELECT-Unterabfragen kann jedoch eventuell erzwungen werden.