Funktionsbasiertes mehrdimensionales Datenmodell (FMDM)

Hahne, Michael

doi:10.1007/978-3-322-89790-9_5

Michael Hahne

121 Accesses

Zusammenfassung

Im vorangegangenen vierten Kapitel wurde die Abbildung mehrdimensionaler Datenstrukturen auf formaler logischer Modellebene auf Basis des Relationenmodells dargestellt. Damit wurde der Grundstein für eine formale Spezifikation der logischen Modellebene für relationale Ansätze von OLAP-Lösungen (ROLAP) bzw. relational implementierter Data Warehouse-Lösungen gelegt.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Log in via an institution

Chapter: USD 29.95; Price excludes VAT (USA)

eBook: USD 44.99; Price excludes VAT (USA)

Softcover Book: USD 59.99; Price excludes VAT (USA)

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Preview

Unable to display preview. Download preview PDF.

Literatur

Das bedeutet, dass jedem Knoten genau eine natürliche Zahl zugewiesen wird und zwei verschiedenen Knoten auch verschiedene Zahlen zugewiesen werden, so dass die Knoten „abgezählt“ werden können. Vgl. Kerner et. al. (1988) S. 113.
Google Scholar
Unter der Kantenmenge wird, nicht ganz präzise, auch die Menge aller gerichteten Kanten eines gerichteten Graphen verstanden. Korrekter wäre hier der Begriff der Pfeilmenge.
Google Scholar
Der Begriff Niveau bezeichnet bei Baumstrukturen den Abstand eines Knotens von der Wurzel, d. h. die Länge eines Weges von der Wurzel zu dem Knoten. Dieser Weg ist bei Bäumen eindeutig bestimmt. Daraus ergibt sich auch eine eindeutige Zuordnung der Knoten eines Baumes zu Niveaus, d. h. den Knotenmengen mit gleichem Abstand von der Wurzel. Zu den Begriffen der Graphentheorie vgl. auch Anhang A in Hahne (2002).
Google Scholar
Der Übergang von einer Dimension zu der typisierten Form wird auf semantischer bzw. konzeptioneller Ebene ausführlich in Schelp (2000) diskutiert, vgl. Schelp (2000), S. 241 ff.
Google Scholar
Der Begriff der Dimension, wie er hier verwendet wird, bezeichnet eine Struktur, die auch als eine Substruktur im Sinne einer Teildimension bezeichnet werden kann. Nach der Vorgehensweise in dieser Arbeit bezeichnet das Dimensionsschema die Gesamtheit der Dimensionselemente und ihrer hierarchischen Anordnung, und der Übergang zu einer Teilmenge liefert dann die Instanz in Form einer konkreten Dimension. Diese strenge Differenzierung zwischen Dimensionsschema und Dimension wird aus Gründen der Stringenz und der formal einheitlichen Methode als wesentlich für den weiteren Entwurf des FMDM postuliert.
Google Scholar
Einen ähnlichen Ansatz verfolgen auch Li und Wang in ihrem Datenmodell für OLAP, in denen der Cube als Abbildung in einen skalaren Datentypen definiert wird, deren Definitionsbereich eine Menge von Dimensions-Relationen ist, vgl. Chang/Garcia-Molina/Paepcke (1996), S. 82.
Google Scholar
Dieser Ansatz ist konträr zur Definition eines Kubus als mehrdimensionales Array. Vom Resultat ist der Unterschied aber zu vernachlässigen.
Google Scholar
Genaugenommen ist dort nur eine Hierarchie dargestellt, welche jedoch ohne Einschränkung auch als Dimension interpretiert werden kann.
Google Scholar
Markierte bzw. beschriftete Graphen werden in Hahne (2002) im Anhang A.l eingeführt. Die Markierungsmengen sind in dieser Definition Wertebereich für die Beschriftung.
Google Scholar
Vgl. hierzu Hahne/Schelp (1997) S. 38f.
Google Scholar
Vgl. hierzu auch Anhang A in Hahne (2002).
Google Scholar
Vgl.Schelp(2000), S.241ff.
Google Scholar
Diese Form der Abbildung von Attributen impliziert auch, dass jedes Attribut für jedes Dimensionselement gleichermassen definiert ist. Dieser Ansatz unterscheidet sich von der Einführung von Attributen (features) in dem Datenmodell Cross-DB, einem um Attribute erweiterten mehrdimensionalen Datenmodell für Statistische Datenbanken, in dem die Attribute aufgrund eines objektorientierten Ansatzes durch die einzelnen Verdichtungsstufen hindurch nach unten vererbt werden. Auf granulärerer EBene können dann zusätzlich zu den vererbten Attributen auch noch weitere hinzutreten. Vgl. hierzu Lehner/Ruf/Teschke (1996), S. 3f.
Google Scholar
Ein unärer Operator hat nur einen Argumentwert.
Google Scholar
Dieser Ansatz permutiert die totale Ordnung der Dimensionselemente unabhängig von einer Definition der Berechnung der Rangfolge. Sind die Wertebereiche der Dimensionselemente selbst total geordnet, kann auf dieser Basis eine Funktion zur Ordnung angegeben werden, die dann auch auf Basis weiterer deskriptiver Attribute der Dimension möglich ist. Einen ähnlichen Ansatz verfolgen auch Li und Wang in ihrem Datenmodell, vgl. Chang et. al. (1996), S. 84.
Google Scholar
Dieser Datentyp ist im allgemeinen nicht eindeutig definiert, die darauf definierten Operationen erst recht nicht. Zur Veranschaulichung der Möglichkeiten im Rahmen der Selektion genügt aber diese ungenaue Begriffsfassung.
Google Scholar
Die Festlegung der Projektions-Operation korrespondiert mit der destroy-Operation im Modell von Agrawal, Gupta und Sarawagi, vgl. Agrawal/Gupta/Sarawagi (1997), S. 8.
Google Scholar
Vgl. Chang et. al. (1996), S. 86f.
Google Scholar
In der Tat ist die Modellierung einer mehrdimensionalen Struktur nicht losgelöst von der Applikation, mit der diese Strukturen analysiert werden, zu betrachten. Für spezielle Front-End-Applikationen kann es durchaus sehr sinnvoll sein, einzelne Attribute als eigene Dimension zu betrachten.
Google Scholar
Vgl. Agrawal et. al. (1997), S. 9f.
Google Scholar
In dem von Gyssens und Lakshmanan eingeführten konzeptionellen Datenmodell erfolgt z. B. eine an das Relationenmodell angelehnte Darstellung von Verdichtungsoperatoren, aber keine Verteilung, vgl. Gyssens/Lakshmanan (1996).
Google Scholar
Die formale Definition eines Modells für statistische Datenbanken erfolgt bei Lehner (1997), in der für die Verdichtung die drei Typen der additiven, gewichteten und konstanten Verdichtungsoperation unterschieden werden, mit denen Summen, Minimal- und Maximalwerte, Durchschnitt und Anzahl berechnet werden können. Als Datentypen der Werte werden nur ℕ, ℤ und ℝ erlaubt. Vgl. Lehner (1997).
Google Scholar
Vgl. auch Hahne/Schelp (1997), Definition 5.7 und 5.8 auf S. 6f.
Google Scholar
Im strengen Sinne ist ℤ ein kommutativer Ring mit Einselement. Hier werden nur kommutative Ringe mit Einselement betrachtet, da der allgemeine Fall bei den im folgenden zu betrachtenden Strukturen nicht auftritt. In Storch/Wiebe (1990) werden Ringe mit Einselement und ohne Kommutativität eingeführt. Bei Waerden (1993) werden Ringe explizit ohne Einselement eingeführt, und es wird im Fall der Existenz eines solchen Einselementes von Ringen mit Einselement gesprochen.
Google Scholar
Für die Definition des Körpers wird die Kommutativität des Ringes gefordert. Werden allgemeine, d. h. nicht notwendig kommutative Ringe betrachtet, tritt das Gesetz der Kommutativität der Multiplikation als explizite Forderung in der Definition des Körpers auf.
Google Scholar
Vgl. Scheja/Storch (1980), S. 101.
Google Scholar
Vgl. Kasch (1977) für einen systematischen Aufbau der Theorie der Moduln.
Google Scholar
In der Mathematik ist dies ein übliches Problem: Zum einen gibt es gewisse von einer breiten Mehrheit getragene, historisch entstandene Begriffe, zum anderen erfordert eine stringente begriffliche Differenzierung und Klarheit eine Neufassung der Begriffe. Dieser Antagonismus ist scheinbar unvermeidbar.
Google Scholar
Die Problematik mit dem Element undefined führt in eine ähnliche Komplexität wie die Behandlung der NULL-Werte im Relationenmodell.
Google Scholar
Vgl. Brodie(1984), S.20f.
Google Scholar
Die Spezifikation einer Abfragesprache bleibt für das funktionsbasierte mehrdimensionale Datenmodell offen. In der Literatur werden für Anfragesprachen an mehrdimensonale Modelle oft SQL-ähnliche Sprachen definiert, so z. B. in Bauer/Lehner (1997) im Rahmen des CubeStar-Projektes.
Google Scholar
Vgl. Kimball (1996) S. 127.
Google Scholar
Ganz allgemein erfolgt in der Syntaxanalyse keine Prüfung der semantischen Stimmigkeit. Bei Programmiersprachen erfolgt z. B. die Prüfung von Datentypenverträglichkeit ebenfalls nicht in der Phase der Syntaxüberprüfung.
Google Scholar
Vgl. Naur (1963) Seite 4f.
Google Scholar
Hierzu muss allerdings auch das FMDM, das hier beschriebene logische Datenmodell, noch entsprechend erweitert werden.
Google Scholar
Zu berücksichtigen ist, dass die Definition von Baumstrukturen nicht notwendig daran gekoppelt ist, dass der zugrunde liegende Graph gerichtet ist. Vgl. hierzu auch Anhang A in Hahne (2002).
Google Scholar
Dieser Mechanismus ist in Systemprodukten nicht unbekannt. In SAP BW etwa wird dies durch den Begriff eines Multicube ausgedrückt.
Google Scholar
Vgl. Bulos (1996), S. 34.
Google Scholar

Download references

Authors

Michael Hahne
View author publications
You can also search for this author in PubMed Google Scholar

Rights and permissions

Reprints and permissions

Copyright information

About this chapter

Cite this chapter

Hahne, M. (2002). Funktionsbasiertes mehrdimensionales Datenmodell (FMDM). In: Logische Modellierung mehrdimensionaler Datenbanksysteme. Deutscher Universitätsverlag, Wiesbaden. https://doi.org/10.1007/978-3-322-89790-9_5

Download citation

DOI: https://doi.org/10.1007/978-3-322-89790-9_5
Publisher Name: Deutscher Universitätsverlag, Wiesbaden
Print ISBN: 978-3-8244-2159-6
Online ISBN: 978-3-322-89790-9
eBook Packages: Springer Book Archive

Publish with us

Policies and ethics