Zusammenfassung
Im vorangegangenen vierten Kapitel wurde die Abbildung mehrdimensionaler Datenstrukturen auf formaler logischer Modellebene auf Basis des Relationenmodells dargestellt. Damit wurde der Grundstein für eine formale Spezifikation der logischen Modellebene für relationale Ansätze von OLAP-Lösungen (ROLAP) bzw. relational implementierter Data Warehouse-Lösungen gelegt.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Preview
Unable to display preview. Download preview PDF.
Literatur
Das bedeutet, dass jedem Knoten genau eine natürliche Zahl zugewiesen wird und zwei verschiedenen Knoten auch verschiedene Zahlen zugewiesen werden, so dass die Knoten „abgezählt“ werden können. Vgl. Kerner et. al. (1988) S. 113.
Unter der Kantenmenge wird, nicht ganz präzise, auch die Menge aller gerichteten Kanten eines gerichteten Graphen verstanden. Korrekter wäre hier der Begriff der Pfeilmenge.
Der Begriff Niveau bezeichnet bei Baumstrukturen den Abstand eines Knotens von der Wurzel, d. h. die Länge eines Weges von der Wurzel zu dem Knoten. Dieser Weg ist bei Bäumen eindeutig bestimmt. Daraus ergibt sich auch eine eindeutige Zuordnung der Knoten eines Baumes zu Niveaus, d. h. den Knotenmengen mit gleichem Abstand von der Wurzel. Zu den Begriffen der Graphentheorie vgl. auch Anhang A in Hahne (2002).
Der Übergang von einer Dimension zu der typisierten Form wird auf semantischer bzw. konzeptioneller Ebene ausführlich in Schelp (2000) diskutiert, vgl. Schelp (2000), S. 241 ff.
Der Begriff der Dimension, wie er hier verwendet wird, bezeichnet eine Struktur, die auch als eine Substruktur im Sinne einer Teildimension bezeichnet werden kann. Nach der Vorgehensweise in dieser Arbeit bezeichnet das Dimensionsschema die Gesamtheit der Dimensionselemente und ihrer hierarchischen Anordnung, und der Übergang zu einer Teilmenge liefert dann die Instanz in Form einer konkreten Dimension. Diese strenge Differenzierung zwischen Dimensionsschema und Dimension wird aus Gründen der Stringenz und der formal einheitlichen Methode als wesentlich für den weiteren Entwurf des FMDM postuliert.
Einen ähnlichen Ansatz verfolgen auch Li und Wang in ihrem Datenmodell für OLAP, in denen der Cube als Abbildung in einen skalaren Datentypen definiert wird, deren Definitionsbereich eine Menge von Dimensions-Relationen ist, vgl. Chang/Garcia-Molina/Paepcke (1996), S. 82.
Dieser Ansatz ist konträr zur Definition eines Kubus als mehrdimensionales Array. Vom Resultat ist der Unterschied aber zu vernachlässigen.
Genaugenommen ist dort nur eine Hierarchie dargestellt, welche jedoch ohne Einschränkung auch als Dimension interpretiert werden kann.
Markierte bzw. beschriftete Graphen werden in Hahne (2002) im Anhang A.l eingeführt. Die Markierungsmengen sind in dieser Definition Wertebereich für die Beschriftung.
Vgl. hierzu Hahne/Schelp (1997) S. 38f.
Vgl. hierzu auch Anhang A in Hahne (2002).
Vgl.Schelp(2000), S.241ff.
Diese Form der Abbildung von Attributen impliziert auch, dass jedes Attribut für jedes Dimensionselement gleichermassen definiert ist. Dieser Ansatz unterscheidet sich von der Einführung von Attributen (features) in dem Datenmodell Cross-DB, einem um Attribute erweiterten mehrdimensionalen Datenmodell für Statistische Datenbanken, in dem die Attribute aufgrund eines objektorientierten Ansatzes durch die einzelnen Verdichtungsstufen hindurch nach unten vererbt werden. Auf granulärerer EBene können dann zusätzlich zu den vererbten Attributen auch noch weitere hinzutreten. Vgl. hierzu Lehner/Ruf/Teschke (1996), S. 3f.
Ein unärer Operator hat nur einen Argumentwert.
Dieser Ansatz permutiert die totale Ordnung der Dimensionselemente unabhängig von einer Definition der Berechnung der Rangfolge. Sind die Wertebereiche der Dimensionselemente selbst total geordnet, kann auf dieser Basis eine Funktion zur Ordnung angegeben werden, die dann auch auf Basis weiterer deskriptiver Attribute der Dimension möglich ist. Einen ähnlichen Ansatz verfolgen auch Li und Wang in ihrem Datenmodell, vgl. Chang et. al. (1996), S. 84.
Dieser Datentyp ist im allgemeinen nicht eindeutig definiert, die darauf definierten Operationen erst recht nicht. Zur Veranschaulichung der Möglichkeiten im Rahmen der Selektion genügt aber diese ungenaue Begriffsfassung.
Die Festlegung der Projektions-Operation korrespondiert mit der destroy-Operation im Modell von Agrawal, Gupta und Sarawagi, vgl. Agrawal/Gupta/Sarawagi (1997), S. 8.
Vgl. Chang et. al. (1996), S. 86f.
In der Tat ist die Modellierung einer mehrdimensionalen Struktur nicht losgelöst von der Applikation, mit der diese Strukturen analysiert werden, zu betrachten. Für spezielle Front-End-Applikationen kann es durchaus sehr sinnvoll sein, einzelne Attribute als eigene Dimension zu betrachten.
Vgl. Agrawal et. al. (1997), S. 9f.
In dem von Gyssens und Lakshmanan eingeführten konzeptionellen Datenmodell erfolgt z. B. eine an das Relationenmodell angelehnte Darstellung von Verdichtungsoperatoren, aber keine Verteilung, vgl. Gyssens/Lakshmanan (1996).
Die formale Definition eines Modells für statistische Datenbanken erfolgt bei Lehner (1997), in der für die Verdichtung die drei Typen der additiven, gewichteten und konstanten Verdichtungsoperation unterschieden werden, mit denen Summen, Minimal- und Maximalwerte, Durchschnitt und Anzahl berechnet werden können. Als Datentypen der Werte werden nur ℕ, ℤ und ℝ erlaubt. Vgl. Lehner (1997).
Vgl. auch Hahne/Schelp (1997), Definition 5.7 und 5.8 auf S. 6f.
Im strengen Sinne ist ℤ ein kommutativer Ring mit Einselement. Hier werden nur kommutative Ringe mit Einselement betrachtet, da der allgemeine Fall bei den im folgenden zu betrachtenden Strukturen nicht auftritt. In Storch/Wiebe (1990) werden Ringe mit Einselement und ohne Kommutativität eingeführt. Bei Waerden (1993) werden Ringe explizit ohne Einselement eingeführt, und es wird im Fall der Existenz eines solchen Einselementes von Ringen mit Einselement gesprochen.
Für die Definition des Körpers wird die Kommutativität des Ringes gefordert. Werden allgemeine, d. h. nicht notwendig kommutative Ringe betrachtet, tritt das Gesetz der Kommutativität der Multiplikation als explizite Forderung in der Definition des Körpers auf.
Vgl. Scheja/Storch (1980), S. 101.
Vgl. Kasch (1977) für einen systematischen Aufbau der Theorie der Moduln.
In der Mathematik ist dies ein übliches Problem: Zum einen gibt es gewisse von einer breiten Mehrheit getragene, historisch entstandene Begriffe, zum anderen erfordert eine stringente begriffliche Differenzierung und Klarheit eine Neufassung der Begriffe. Dieser Antagonismus ist scheinbar unvermeidbar.
Die Problematik mit dem Element undefined führt in eine ähnliche Komplexität wie die Behandlung der NULL-Werte im Relationenmodell.
Vgl. Brodie(1984), S.20f.
Die Spezifikation einer Abfragesprache bleibt für das funktionsbasierte mehrdimensionale Datenmodell offen. In der Literatur werden für Anfragesprachen an mehrdimensonale Modelle oft SQL-ähnliche Sprachen definiert, so z. B. in Bauer/Lehner (1997) im Rahmen des CubeStar-Projektes.
Vgl. Kimball (1996) S. 127.
Ganz allgemein erfolgt in der Syntaxanalyse keine Prüfung der semantischen Stimmigkeit. Bei Programmiersprachen erfolgt z. B. die Prüfung von Datentypenverträglichkeit ebenfalls nicht in der Phase der Syntaxüberprüfung.
Vgl. Naur (1963) Seite 4f.
Hierzu muss allerdings auch das FMDM, das hier beschriebene logische Datenmodell, noch entsprechend erweitert werden.
Zu berücksichtigen ist, dass die Definition von Baumstrukturen nicht notwendig daran gekoppelt ist, dass der zugrunde liegende Graph gerichtet ist. Vgl. hierzu auch Anhang A in Hahne (2002).
Dieser Mechanismus ist in Systemprodukten nicht unbekannt. In SAP BW etwa wird dies durch den Begriff eines Multicube ausgedrückt.
Vgl. Bulos (1996), S. 34.
Rights and permissions
Copyright information
© 2002 Springer Fachmedien Wiesbaden
About this chapter
Cite this chapter
Hahne, M. (2002). Funktionsbasiertes mehrdimensionales Datenmodell (FMDM). In: Logische Modellierung mehrdimensionaler Datenbanksysteme. Deutscher Universitätsverlag, Wiesbaden. https://doi.org/10.1007/978-3-322-89790-9_5
Download citation
DOI: https://doi.org/10.1007/978-3-322-89790-9_5
Publisher Name: Deutscher Universitätsverlag, Wiesbaden
Print ISBN: 978-3-8244-2159-6
Online ISBN: 978-3-322-89790-9
eBook Packages: Springer Book Archive