Kriterien zur Bewertung der Eignung logischer Datenmodelle für die Abbildung mehrdimensionaler Datenstrukturen

Hahne, Michael

doi:10.1007/978-3-322-89790-9_3

Kriterien zur Bewertung der Eignung logischer Datenmodelle für die Abbildung mehrdimensionaler Datenstrukturen

Michael Hahne

Chapter

121 Accesses

Zusammenfassung

Die Mehrdimensionalität ist das zentrale Wesensmerkmal analyseorientierter Systeme, deren datenbanktechnische Realisierung in dieser Arbeit näher untersucht wird. Hierzu gibt es verschiedene Wege der Speicherung in Datenbanksystemen. Jede Form der dauerhaften Ablage mehrdimensionaler Datenstrukturen in einem System basiert jedoch auf einem konkreten logischen Datenmodell, das, als theoretisches Konzept betrachtet, das formale Fundament des zugrunde liegenden Datenbanksystems formt. Diese Modelle können hinsichtlich ihrer Eignung zur Berücksichtigung mehrdimensionaler Strukturen bewertet werden. Hierfür wird in diesem Kapitel ein konkretes Bewertungsraster in Form mehrerer Kriterien entwickelt.

This is a preview of subscription content, log in via an institution.

Chapter: USD 29.95; Price excludes VAT (USA)

eBook: USD 44.99; Price excludes VAT (USA)

Softcover Book: USD 59.99; Price excludes VAT (USA)

Tax calculation will be finalised at checkout

Purchases are for personal use only

Learn about institutional subscriptions

Preview

Unable to display preview. Download preview PDF.

Literatur

Der Begriff Business Intelligence, wie er 1989 von der Gartrier Group geprägt wurde, ist sehr eng gefasst und bezeichnet den Prozess der Transformation von Daten in Informationen sowie die Entdeckung weiterer Schlussfolgerungen aus diesen Informationen (Vgl. Behme/Mucksch (1997), S. 15). Meistens wird jedoch Business Intelligence nicht im Sinne dieses Prozesses, sondern ganz allgemein im Sinne eines Analytischen Informationssystems gesehen, d. h. einem System, bei dem die Analyse im Vordergrund steht (Vgl. Gluchowski et. al. (1997)).
Google Scholar
Der Begriff der Optimierung wird dem allgemeinen Sprachgebrauch folgend in diesem Zusammenhang im Sinne einer Verbesserung benutzt und ist von dem mathematischen Begriff der Optimierung zu differenzieren.
Google Scholar
Vgl. Gabriel/Dittmar (1999) für eine detaillierte Darstellung der TOPBIKE-Fallsrudie.
Google Scholar
Vgl. hierzu z. B. McGuff (1998), Silverston/Inmon/Graziano (1997) sowie Golfarelli/Maio/Rizzi (1998).
Google Scholar
Vgl. Gabriel/Gluchowski (1997), S. 24ff.
Google Scholar
An dieser Stelle wird nur auf eine Dimension Bezug genommen, um nicht schon an dieser Stelle die gesamte Semantik des Anwendungsbeispiels mit aufbauen zu müssen.
Google Scholar
Vgl. Hahne (1998), S.7.
Google Scholar
Vgl. Gabriel/Gluchowski (1997), S.25.
Google Scholar
Vgl. Schelp (1999), S. 285f.
Google Scholar
In manchen Systemprodukten werden nur Baumstrukturen unterstützt, da der Dimensionsname selbst als oberster Knoten, die Wurzel des Baumes, definiert wird. Vgl. Hahne (1998), S. 27ff.
Google Scholar
Ob dies in den semantischen Kontext passt, ist dabei eine andere Frage.
Google Scholar
Unbalancierte bzw. unausgeglichene hierarchische Strukturen werden auch unter dem Begriff der Strukturanomalie gefasst. Vgl. Holthuis (1997), S. 145f.
Google Scholar
Dies könnte etwa dann der Fall sein, wenn historische Daten nur auf Monatsebene oder gar nur auf Jahresebene vorliegen, die aktuellen Daten jedoch sehr viel granularer.
Google Scholar
Vgl. Holthuis (1997), S. 155ff.
Google Scholar
Vgl. Schelp (1999), S. 288.
Google Scholar
In der Darstellung mehrdimensionaler Datenstrukturen in der Literatur spielen Attribute häufig eine eher untergeordnete Rolle. In Darstellungen, die auf den Einsatz relationaler Datenbanktechnik abzielen, wird hingegen betont, dass vernünftige und zahlreiche Attribute das Wesen eines mehrdimensionalen Modells ausmachen, vgl. Kimball (1996), S. 17f. Allerdings sind unter diesem Attributsbegriff ebenfalls Aggregatknoten in der Hierarchie mit zu fassen. Die praktische Relevanz von Attributen drückt sich in der zunehmenden Unterstützung vielfältiger Formen von Attributen in verfügbaren Systemprodukten aus, vgl. Hahne (1998).
Google Scholar
Zur Gruppenbildung in Dimensionshierarchien vgl. Schelp (2000), S. 241ff.
Google Scholar
Das Attribut (als Schema) ist dann für alle Dimensionselemente definiert, die Attribut-Ausprägungen der einzelnen Elemente können unterschiedlich sein.
Google Scholar
Vgl. auch Abbildung 3.12.
Google Scholar
Dieser Aspekt tangiert insofern die Schnittstelle vom konzeptionellen zum externen Schema. Zwischen der rein logischen Modellebene und dem externen Schema ist daher zu differenzieren.
Google Scholar
Streng genommen ist eine nullstellige Operation der einfachste Fall, was jedoch an dieser Stelle hier keine Rolle spielt.
Google Scholar
Vgl. Gabriel/Gluchowski (1997), S. 26.
Google Scholar
Vgl. Gabriel/Gluchowski (1997), S. 21.
Google Scholar
Meyer (1994), S. 1.
Google Scholar
Bei OLAP-Datenbanken wird statt von Kennzahl oft von Variable gesprochen, vgl. Pilot Software (1995), S. 14f.
Google Scholar
Vgl. Küting (1983).
Google Scholar
Vgl. Reichmann (1997), S. 25.
Google Scholar
Für eine umfangreiche Übersicht über Kennzahlen und Kennzahlensysteme vgl. Michel (1999).
Google Scholar
Dies ist natürlich eine im allgemeinen nicht zu haltende Einschränkung an mehrdimensionale Datenmodelle.
Google Scholar
Die Richtung der Pfeile ergibt sich aus der für Bäume üblichen Notation, da Kennzahlensysteme meistens vertikal statt horizontal notiert werden.
Google Scholar
McGuff spricht in diesem Zusammenhang von informational dimension, vgl. McGuff (1996), S. 12ff.
Google Scholar
Bei dieser Modellierungsvariante wird auch oft vom Hypercube-Ansatz gesprochen, da alle Kennzahlen in einem großen Würfel untergebracht sind.
Google Scholar
Oftmals wird das Data Warehouse-Konzept mit dem Grundsatz verbunden, dass ein einmal vorhandener Wert nicht mehr verändert werden soll, damit gleiche Abfragen auf dem Data Warehouse-Datenbestand auch immer zu dem gleichen Berichtsergebnis führen. Ist eine Differenzierung zwischen der berichteten Periode und der Periode, in der berichtet wird, notwendig (z. B. wenn in einem Modell, welches die aktuellen Erfüllungsgrade und aufgelaufenen Iststunden sowie die Plansrunden für Projekte beinaltet), so kann dies über zwei Zeitdimensionen abgebildet werden, etwa die Dimensionen Zeit und Berichtszeit.
Google Scholar
Vgl. u. a. Chawathe/Rajaraman/Garcia-Molina/Widom (1996) für einen Algorithmus speziell auf Basis hierarchischer Strukturen.
Google Scholar
Vgl. beispielsweise Lenz/Shoshani (1997) sowie auch Gabriel/Gluchowski (1997).
Google Scholar
Gabriel/Gluchowski (1997), S. 26.
Google Scholar
Vgl. Shoshani (1997), S. 4f.
Google Scholar
Zum Begriff der Additivität von Kennzahlen vgl. Kimball (1996), S.12f.
Google Scholar
Dies wird insbesondere an Kennzahlen deutlich, die nur bezogen auf die Zeitdimension nicht additiv sind (es wird dann auch von semi-additiver Kennzahl gesprochen), wie etwa Bestandsgrößen. Daher wird oftmals die Zeitdimension gesondert gekennzeichnet, vgl. auch Hahne (1998).
Google Scholar
Bei statistischen Datenbanken wird explizit differenziert zwischen micro-data, den Basisdaten, und macro-data, die die aggregierten Daten repräsentieren. Vgl. Shoshani (1997), S. 5.
Google Scholar
Vgl. Lehner/Albrecht/Wedekind (1998), S. 2.
Google Scholar
Ebenfalls auf physischer Modellebene ist die Diskussion der physischen Ablage oder dynamischen Kalkulation von Werten angesiedelt. Dies ist aber ein weiterer Aspekt von zu berücksichtigenden Regeln in mehrdimensionalen Datenmodellen, vgl. Gabriel/Gluchowski (1997), S. 27.
Google Scholar

Download references

Authors

Michael Hahne
View author publications
You can also search for this author in PubMed Google Scholar

Rights and permissions

Reprints and permissions

Copyright information

About this chapter

Cite this chapter

Hahne, M. (2002). Kriterien zur Bewertung der Eignung logischer Datenmodelle für die Abbildung mehrdimensionaler Datenstrukturen. In: Logische Modellierung mehrdimensionaler Datenbanksysteme. Deutscher Universitätsverlag, Wiesbaden. https://doi.org/10.1007/978-3-322-89790-9_3

Download citation

DOI: https://doi.org/10.1007/978-3-322-89790-9_3
Publisher Name: Deutscher Universitätsverlag, Wiesbaden
Print ISBN: 978-3-8244-2159-6
Online ISBN: 978-3-322-89790-9
eBook Packages: Springer Book Archive

Publish with us

Policies and ethics

Zusammenfassung

Buying options