Der Bereich Ansichten ermöglicht es Ihnen, die Daten und den generierten SQL-Code anzuzeigen, um die Optionen festzulegen.
Auf dieser Registerkarte wird die Quelltabelle vorhandener Felder angezeigt, und Sie können eigene Felder hinzufügen.
Folgende Operationen sind zu vorhandenen Feldern verfügbar:
Beim Anlegen eines neuen berechneten Feldes stehen Ihnen folgende Typen zur Auswahl:
Diese Option zeigt die aus der Datenbank extrahierten Daten an, wenn dieses analytische Datenset ausgeführt wird. Zudem liefert sie Statistiken zu diesen Daten. Die Option ermöglicht es Ihnen, zu prüfen, ob die Ergebnisse dem entsprechen, was Sie erwarten.
Sie können die Tabelle sortieren, indem Sie auf den Kopf der entsprechenden Spalte klicken.
Auf dieser Registerkarte wird die SQL-Abfrage angezeigt, die zu dem angelegten analytischen Datenset gehört.
Auf der Registerkarte Dokumentation können Sie sich einen Überblick über das analytische Datenset verschaffen. Hier sind alle für das analytische Datenset ausgewählten Optionen enthalten, z.B. Filter, Zusammenführen, Aufforderungen oder Ausdrücke.
In diesem Bild wird Folgendes angezeigt:
In der Grafikübersicht wird Folgendes angezeigt:
"Sichtbare Felder" zeigt in einer Tabelle die Sortierungsspalten der sichtbaren Felder an, usw.
Diese Übersicht kann mit der Option "Einstellungen" angepasst werden:
In den Übersichtseinstellungen können Sie entscheiden, wie die Übersicht sowohl für die Anzeige als auch den Export formatiert wird
. Die generierte Datei kann in den Dateiformaten .txt, .htm und .rtf gesichert werden.
Mit der Drucktaste Info können Sie technische Informationen zur Datenbank anzeigen, in der sich Ihre Daten befinden. Es werden die folgenden Informationen bereitgestellt:
| Optionen | Beschreibung | Werte/Standard |
|---|---|---|
| Ausdrücke mit mehreren Referenzen optimieren | Bei einem analytischen Datenset können zwei Strategien eingesetzt werden, wenn ein berechnetes Feld bzw. ein Ausdruck mehr als einmal referenziert wird:
|
Auto (Standard): Die Strategie wird vom System automatisch ausgewählt. Wenn ein Feld mehr als einmal referenziert wird, wird standardmäßig die optimierte Strategie verwendet. Aktiviert: Die optimierte Strategie wird verwendet. Deaktiviert: Die Standardstrategie wird verwendet. |
| Maximale Anzahl der Ausdruckswiederverwendungen vor der Optimierung | Wenn die Option "Ausdrücke mit mehreren Referenzen optimieren" aktiviert ist, können Sie angeben, wie oft ein Feld bzw. ein Ausdruck referenziert werden muss, bevor die optimierte Strategie verwendet wird.
|
Standardmäßig liegt die Schwelle bei 2, d. h., wenn das Feld mehr als einmal referenziert wird, wird die optimierte Strategie angewendet. |
| Mehrere Abfragen generieren | Mit dieser Option kann die Aufteilung von analytischen Datensets in kleinere Zwischenschritte (automatisch vom System festegelegt) erzwungen oder deaktiviert werden.
|
Auto (Standard): Je nach der relativen Komplexität des analytischen Datensets, entscheidet das System, ob die Aufteilung aktiviert wird. Aktiviert: Das analytische Datenset wird ungeachtet seiner Komplexität in Zwischenschritte aufgeteilt. Deaktiviert: Das analytische Datenset wird nie in Zwischenschritte aufgeteilt, unabhängig davon, wie komplex es ist. Dieser Wert sollte nur mit größter Sorgfalt ausgewählt werden. |
| Standardaggregate als korrelierte Tabellen generieren | Mit dieser Option kann die Generierung von Standardaggregaten erzwungen oder deaktiviert werden (min, max, count, avg), wobei korrelierte Tabellen anstatt von SELECT-Unterabfragen verwendet werden. | Auto (Standard): Das System wählt automatisch aus, welche Art von Aggregatgenerierung eingesetzt wird. Aktiviert: Wenn es das RDBMS erlaubt, werden korrelierte Tabellen generiert. Deaktivieren: Wenn es das RDBMS erlaubt, werden Unterabfragen generiert. Bei einigen Datenbanken werden diese Optionen ignoriert, wenn nur eine der beiden Formen unterstützt wird. MySQL unterstützt beispielsweise nur SELECT-Unterabfragen, Teradata hingegen nur korrelierte Tabellen. Eine Liste der Datenbanken, die die jeweilige Form unterstützen, finden Sie im Abschnitt "Unterstützte Aggregat-SQL-Formen" (auf Seite 75). |
| Aggregate mit der Bezeichnung "First/Last" als korrelierte Tabellen generieren | Mit dieser Option kann die Generierung des Aggregats First/Last mithilfe korrelierter Tabellen anstelle von SELECT-Unterabfragen erzwungen bzw. deaktiviert werden. | |
| Aggregate mit der Bezeichnung "Exists" als korrelierte Tabellen generieren | Mit dieser Option kann die Generierung der Aggregate Exists mithilfe korrelierter Tabellen anstatt von SELECT-Unterabfragen erzwungen bzw. deaktiviert werden. | |
| Nach jeder Abfrage Zusammenführungsbedingungen generieren | Aus Gründen der Deutlichkeit steht die Bezeichnung (T1,T2) für die Operation der (äußeren linken) Verknüpfung von T1 und T2 zu einer bestimmten Bedingung. In einer langen Kette/Sequenz von Tabellenverknüpfungen, z. B. ((T1,(T2,T4)), (T3,T4)), können einige der Verknüpfungsbedingungen gleich nach der Verknüpfung oder am Ende der Abfrage ohne Auswirkung auf den resultierenden Zeilensatz generiert werden. In einigen Fällen werden endpositionierte Verküpfungsbedingungen die Performance der generierten SQL negativ beeinflussen. Mit dieser Option kann die Position von Verknüpfungsbedingungen festgelegt werden.
|
Auto (Standard): Die bevorzugte Form wird vom System automatisch entsprechend der Experimente zu der betreffenden Datenbank ausgewählt. Aktiviert: Die Verknüpfungsbedingungen werden gleich nach der Verknüpfungsoperation generiert. Deaktiviert: Die Verknüpfungsbedingungen werden am "Ende" der Verknüpfungskette generiert.
|
| Populationen mit Zeitstempel materialisieren | In der operativen Umgebung generieren analytische Automated-Analytics-Datensets kompliziertes SQL, das eventuell von manchen RDBMS-Optimierern nicht korrekt analysiert wird. Das konnte besonders beobachtet werden, wenn gefilterte Populationen mit Zeitstempel beteiligt sind. Um dies zu umgehen, ist es hilfreich, die Population mit Zeitstempel zu materialisieren, damit der Optimierer bessere Entscheidungen für den Ausführungsplan treffen kann. Mit dieser Option kann dieses Verhalten besser gesteuert werden. | Auto (Standard): Das System verwendet bestimmte Regeln, um automatisch zu entscheiden, ob die Materialisierung angewendet werden soll. Zunächst werden alle gefilterten Populationen mit Zeitstempel materialisiert. Aktiviert: Alle Populationen mit Zeitstempel werden materialisiert. Deaktiviert: Populationen mit Zeitstempel werden nie materialisiert. |
| Pivotierte Aggregate gruppieren (nach Pivotwert) | Bei Datenbanken, wie Teradata, Oracle und DB2, werden Aggregate als korrelierte oder abgeleitete Tabellenausdrücke formuliert. In jeder dieser Tabellen werden Aggregate gesammelt, die über denselben Zeilensatz generiert werden. Ein Zeilensatz wird einerseits nach den Schlüsselspalten und andererseits nach der Filterbedingung definiert. Im Filter ist die Zeitfensterspezifikation (sofern vorhanden) zusammen mit einem zusätzlichen Prädikat eingebettet. Mit dieser Option kann dieses Prädikat so generiert werden, dass es berücksichtigt wird, ohne die Filterbedingung negativ zu beeinflussen. D.h., zueinander in Beziehung stehende pivotierte Aggregate werden in unterschiedlichen Tabellen generiert. |
Auto (Standard): Das System entscheidet anhand der Anzahl der in Beziehung stehenden Aggregate, ob der Filterbedingung das zusätzliche Prädikat hinzugefügt wird. Der entsprechende Wert kann über die Option "Maximale Anzahl der Wiederverwendungen der Pivotierungsbedingung vor Gruppierung" festgelegt werden. Aktiviert: Das zusätzliche Prädikat ist nie Teil des Filterausdrucks. Deaktiviert: Das zusätzliche Prädikat ist immer Teil des Filterausdrucks. |
| Maximale Anzahl der Wiederverwendungen der Pivotierungsbedingung vor Gruppierung | Wenn für die Option "Pivotierte Aggregate gruppieren (nach Pivotwert)" die Auswahl "Auto" festgelegt wurde, werden die Aggregate, die das gleiche Zeitfenster teilen, aber unterschiedliche zusätzliche Filterbedingungen ergeben, in einer Gruppe zusammengeführt, sofern ihre Anzahl einen vorgegebenen Schwellenwert übersteigt. Mit dieser Option wird diese Schwelle eingestellt. | Standardmäßig ist für diesen Wert 5 eingestellt. |
| Anzahl der pivotierten Aggregate pro Gruppierung | Wenn für die Option "Pivotierte Aggregate gruppieren (nach Pivotwert)" die Auswahl "Auto" festgelegt wurde, werden die Aggregate, die dasselbe Zeitfenster teilen, aber unterschiedliche zusätzliche Filterbedingungen ergeben, in einer Gruppe zusammengeführt. Mit diesem Parameter kann die maximale Anzahl der Aggregate festgelegt werden, die in einer Gruppe vorhanden sein dürfen. | Standardmäßig ist für diesen Wert 7 eingestellt. |
| Aggregate vorfiltern | Die Tabellenausdrücke, mit denen pivotierte Aggregate gruppiert werden, bieten die Möglichkeit, die von diesen Aggregaten gesehenen Zeilen zu filtern. Beim Vorfiltern sind oft Spalten ohne Index beteiligt, was folglich zu umfassenden Scans führt. Wenn alle in den Aggregatfiltern oder Verknüpfungsbedingungen verwendeten Spalten bekannterweise indiziert sind, kann eine Vorfilterung positive Auswirkungen auf die Peformance haben. Da jedes Aggregat nur die übereinstimmenden Zeilen verarbeitet, kann diese Vorfilterung ausgelassen werden. |
Diese Option ist standardmäßig deaktiviert. |
| Immer sichtbare Felder | Analytische Datenobjekte, wie Entitäten oder Populationen mit Zeitstempel, werden konfiguriert, damit nur ein bestimmter Satz Felder angezeigt wird. Mit dieser Option können Sie andere Felder als sichtbar einstellen, sodass sie Benutzern analytischer Datensets angezeigt werden. | Standardmäßig werden die Felder KxTarget und KxWeight aufgeführt. Um weitere Felder hinzuzufügen, geben Sie deren Namen durch ein Semikolon getrennt ein. |
| Konstantenfelder durch Werte ersetzen | Wenn ein analytisches Datenset ein Feld mit einem konstanten Wert anzeigen soll, wird der tatsächliche Wert zu Optimierungszwecken nach oben propagiert. Die oberen analytischen Datensets werden darüber informiert, dass das betreffende Feld konstant ist und sein Wert daher an allen Stellen verwendet werden muss, an denen der Feldname referenziert wird. Dadurch können analytische Datensets 10 Mal schneller ausgeführt werden. | Diese Option ist standardmäßig aktiviert. Um sie zu deaktivieren, entmarkieren Sie das Ankreuzfeld. |
| Ausdrücke basierend auf Feldern für analytische Teildatensets optimieren | In einem analytischen Datenset werden mehrmals referenzierte Ausdrücke aus Effizienzgründen faktorisiert. Falls bei diesen Ausdrücken einige Felder aus einem verknüpften Datenset bzw. analytischen Teildatenset stammen, ist das System eventuell nicht in der Lage, diese zu faktorisieren. In diesem Fall ist es mit dieser Option möglich, solche Ausdrücke aus dem Faktorisierungsprozess (auch Optimierungsprozess genannt) auszuschließen. Beachten Sie, dass diese Option von den Optionen "Ausdrücke mit mehreren Referenzen optimieren" und "Maximale Anzahl der Ausdruckswiederverwendungen vor der Optimierung" abhängt.
|
Diese Option ist standardmäßig deaktiviert. Um sie zu aktivieren, markieren Sie das Ankreuzfeld. |
| Schlüssel ohne Join nicht aus Zwischenoptimierungen ausschließen | Zu Optimierungszwecken findet die Faktorisierung von Ausdrücken mit mehreren Referenzen nur statt, wenn die zur Berechnung verwendete Tabelle über Schlüsselspalten verfügt. Um bei analytischen Datensets mit mehreren Schritten einen Verstoß gegen Gültigkeits- und Eindeutigkeitsbeschränkungen physischer Schlüssel zu vermeiden, wendet das System bestimmte Regeln an, um nicht erforderliche Schlüssel in Zwischentabellen herauszufiltern. Das kann dazu führen, dass Ausdrücke mit mehreren Referenzen nicht faktorisiert werden. Mit dieser Option wird das System angewiesen, Schlüsselspalten, die im Optimierungsprozess benötigt werden, nicht aus Zwischentabellen auszuschließen. |
Diese Option ist standardmäßig aktiviert. Um sie zu deaktivieren, entmarkieren Sie das Ankreuzfeld. |
| Standard | First/Last | Exists | |
|---|---|---|---|
| Access | Nur Unterabfrage | Nur Unterabfrage | Nur Unterabfrage |
| SQLServer | Korrelierte Tabellen als Standard | Korrelierte Tabellen als Standard | Nur Unterabfrage |
| Oracle | Korrelierte Tabellen als Standard | Nur korrelierte Tabellen | Nur Unterabfrage |
| Teradata | Nur korrelierte Tabellen | Nur korrelierte Tabellen | Nur korrelierte Tabellen |
| DB2 | Nur Unterabfrage | Nur korrelierte Tabellen | Nur Unterabfrage |
| MySQL | Nur Unterabfrage | Nur Unterabfrage | Nur Unterabfrage |
| PostgreSQL | Korrelierte Tabellen als Standard | Nur korrelierte Tabellen | Nur korrelierte Tabellen |
| SybaseIQ | Nur korrelierte Tabellen | Nur korrelierte Tabellen | Nur korrelierte Tabellen |
| Vertica | Nur korrelierte Tabellen | Nur korrelierte Tabellen | Nur korrelierte Tabellen |
| Netezza | Nur korrelierte Tabellen | Korrelierte Tabellen als Standard | Korrelierte Tabellen als Standard |
Beschriftung: