Cubes sind Informationsobjekte, die Kennzahlen mit genau identischen Dimensionen identifizieren und gemeinsam in allen Phasen verarbeitet werden können: Laden von Daten, Aggregation, Speicherung und Abfrage. Mit dem Register "Implementierungs-Details" wird bestimmt, wie die Daten physikalisch gespeichert werden.
Wichtig. Führen Sie den Dünnbesiedelungs-Advisor nach der Zuordnung des Cubes aus, um Empfehlungen für diese Auswahlmöglichkeiten zu erhalten.
Dimensionsreihenfolge und Dünnbesiedelung
Wählen Sie die dünnbesiedelten Dimensionen.
Die Dimensionsreihenfolge ist bei zusammengesetzten Dimensionen wichtig, hat jedoch bei komprimierten zusammengesetzten Dimensionen keine Auswirkung. Sie können die Dimensionen anordnen, indem Sie die dünnbesiedelten Dimensionen in der Liste nach unten unter die dichtbesiedelten Dimensionen verschieben. Alle Dimensionen, die Sie (durch Auswahl des Kontrollkästchens Dünnbesiedelt) als dünnbesiedelt angegeben haben, müssen zusammen gruppiert werden.
Wenn Sie den Dünnbesiedelungs-Advisor nicht verwenden, beachten Sie die folgenden grundlegenden Richtlinien:
Führen Sie zuerst Time auf, um das Laden von Daten und die zeitbasierte Analyse zu beschleunigen. Time ist häufig eine dicht gefüllte Dimension, auch wenn sie dünnbesiedelt sein kann, wenn die Basisebene Tag ist oder der Cube viele Dimensionen hat.
Bei einer regulären zusammengesetzten Dimension führen Sie die dünnbesiedelten Dimensionen von den Dimensionen mit den meisten Elementen bis zu den Dimensionen mit den wenigsten Elementen auf. Bei einer komprimierten zusammengesetzten Dimension führen Sie die dünnbesiedelten Dimensionen von den Dimensionen mit den wenigsten Elementen bis zu den Dimensionen mit den meisten Elementen auf.
Bei Benutzung des Dünnbesiedelungs-Advisors beachten Sie, dass dieser keine Optimierung für das Laden von Daten oder die zeit-basierte Analyse vornimmt. Wenn Sie eine Optimierung für diese Aufgaben vornehmen möchten, gehen Sie von den Empfehlungen ab und listen Time zuerst auf.
Globale zusammengesetzte Dimensionen verwenden
Bei nicht komprimierten, partitionierten Cubes kann zwischen einzelnen (globalen) und mehreren zusammengesetzten Dimensionen gewählt werden. Diese Option definiert eine einzelne zusammengesetzte Dimension für den Cube anstelle einer zusammengesetzten Dimension für jede Partition. Mit einer globalen zusammengesetzten Dimension können Sie:
Redundanz zwischen mehreren zusammengesetzten Dimensionen eliminieren und dadurch die Speicherplatzanforderungen reduzieren.
Die ganze zusammengesetzte Dimension für verbesserte Gesamt-Performance in den Speicher laden.
Eine globale zusammengesetzte Dimension ist unter folgenden Umständen möglicherweise die bessere Lösung:
Die partitionierte Dimension ist dichtbesiedelt. Die Dünnbesiedelungsmuster für die anderen Dimensionen sind über die Partitionen hinweg konsistent.
Die aggregierte zusammengesetzte Dimension überschreitet den verfügbaren Speicherplatz nicht (50 Millionen oder mehr Werte).
Reguläre zusammengesetzte Dimensionen werden benutzt. Komprimierte Cubes können keine globalen zusammengesetzten Dimensionen verwenden.
Der analytische Workspace unterstützt keine Multi-Writer-Anwendungen.
Hinweis: Eine globale zusammengesetzte Dimension lässt keine parallele Aggregation über Partitionen zu. Wenn der analytische Workspace weniger Cubes als verfügbare Prozesse hat, kann die Aggregation der Partitionen im Parallelmodus die Build-Performance eher verbessern als eine globale zusammengesetzte Dimension.
Im Zweifelsfall wählen Sie diese Option nicht. Der Cube hat eine zusammengesetzte Dimension für jede Partition.
Ein nicht partitionierter Cube enthält immer eine zusammengesetzte Dimension für den Cube, unabhängig davon, ob sie komprimiert oder nicht komprimiert ist. Ein partitionierter, komprimierter Cube hat immer eine zusammengesetzte Dimension für jede Partition.
Komprimierung verwenden
Wählen Sie diese Option, wenn die Daten in diesem Cube extrem dünnbesiedelt sind. Beachten Sie, dass eine extreme Dünnbesiedelung recht häufig auftritt.
Extreme Dünnbesiedelung ergibt sich häufig aus einem oder mehreren dieser Faktoren:
Ein Cube hat eine große Anzahl von Dimensionen (sieben oder mehr).
Eine Dimension hat mehr als 300.000 Elemente.
Zwei Dimensionen haben jede mehr als 100.000 Elemente.
Dimensionshierarchien haben verschiedene Ebenen mit wenig Änderungen bei der Anzahl von Dimensionselementen von einer Ebene zur nächsten, sodass viele übergeordnete Elemente nur ein untergeordnetes Element für mehrere fortlaufende Ebenen haben.
Die komprimierte Speicherung belegt weniger Speicherplatz und führt zu einer schnelleren Aggregation als die normale dünnbesiedelte Speicherung bei extrem dünnbesiedelten Cubes.
Einige Aggregationsoperatoren können nicht komprimiert werden, weil sich ihre Werte für jede Ebene ändern können: alle gewichteten Operatoren, alle skalierten Operatoren und der Operator Hierarchisch gewichteter Durchschnitt. Wenn diese Operatoren in einem Cube verwendet werden, komprimiert die Aggregations-Engine die Dimensionen, die komprimiert werden können, kann jedoch nicht den ganzen Cube komprimieren.
Datentyp des Cubes
Bei der komprimierten Speicherung müssen alle Kennzahlen in dem Cube denselben Datentyp haben. Bei der regulären Speicherung ist ein Datentyp mit jeder Kennzahl verknüpft. Je nach Auswahl des Datentyps können Sie die folgenden zusätzlichen Parameter festlegen:
Gesamtstellenzahl: Die Höchstanzahl von signifikanten Stellen.
Nachkommastellen: Die Anzahl von Stellen ab dem Dezimalkomma bis zur letzten signifikanten Stelle.
Größe: Die maximale Länge für Textdatentypen in Byte.
Partitions-Cube
Wählen Sie diese Option, um den Cube zu partitionieren. Durch die Partitionierung wird die Performance von großen Kennzahlen verbessert. Eine Kennzahl mit 50 Millionen zusammengesetzten Tupeln oder mehr sollte partitioniert werden.
Dimension
Wählen Sie die Dimension für die Partitionierung des Cubes. Die Dimension muss mindestens eine ebenenbasierte Hierarchie haben und die Elemente sollten gleichmäßig verteilt sein, sodass jedes übergeordnete Element auf einer bestimmten Ebene etwa dieselbe Anzahl von untergeordneten Elementen hat.
Time ist im Allgemeinen die beste Auswahl, weil sie dieses Kriterium erfüllt. Außerdem werden Daten geladen und nach Zeitperiode archiviert, sodass neue Partitionen erstellt und alte Partitionen im Rahmen des Datenaktualisierungsprozesses gelöscht werden können.
Hierarchie
Wählen Sie die Hierarchie, die für die Partitionierung benutzt werden soll. Wenn die Dimension mehrere Hierarchien hat, wählen Sie die Hierarchie mit den meisten Elementen. Sie sollte als Standardhierarchie definiert werden.
Ebene
Wählen Sie die Ebene, die für die Partitionierung benutzt werden soll. Jedes Dimensionselement auf dieser Ebene wird in einer separaten Partition zusammen mit den untergeordneten Elementen gespeichert. Alle Dimensionselemente, die auf höheren Ebenen enthalten oder nicht in der Hierarchie enthalten sind, werden gemeinsam in der Standardpartition gespeichert. Die Größe der Standardpartition darf die Größe der ebenenbasierten Partitionen nicht überschreiten.
Wählen Sie die Ebene mit Vorsicht, sodass Sie nicht zu viele Partitionen erstellen. Wenn die Zeit-Dimension z.B. 10 Jahre mit Daten auf Jahres-, Quartals-, Monats- und Tagesebene umfasst, könnten Sie eine Partitionierung auf Quartalsebene durchführen. Dabei werden 40 Partitionen erstellt, eine für jedes Quartal und die untergeordneten Objekte (Monate und Tage). Die 10 Elemente auf Jahresebene werden gemeinsam in der Standardpartition gespeichert und können schnell für eine Datenansicht der obersten Ebene abgerufen werden. Wenn die Daten jedoch sehr dünnbesiedelt sind, könnten Sie eine Partitionierung auf Jahresebene vornehmen.
Das Ziel der Partitionierung ist das Erstellen von zusammengesetzten Dimensionen, die in den Speicher passen. Dies optimiert die Performance. Je mehr Speicher der Rechner hat, desto größer können die Partitionen sein und dieses Ziel dennoch erfüllen.
"Basic Elements of Oracle SQL" in SQL Reference enthält eine Beschreibung der Datentypen und impliziten Datenkonvertierungen.
Copyright © 2003, 2007, Oracle. All rights reserved. Alle Rechte vorbehalten,