Zusammenfassung
Die Mehrdimensionalität ist das zentrale Wesensmerkmal analyseorientierter Systeme, deren datenbanktechnische Realisierung in dieser Arbeit näher untersucht wird. Hierzu gibt es verschiedene Wege der Speicherung in Datenbanksystemen. Jede Form der dauerhaften Ablage mehrdimensionaler Datenstrukturen in einem System basiert jedoch auf einem konkreten logischen Datenmodell, das, als theoretisches Konzept betrachtet, das formale Fundament des zugrunde liegenden Datenbanksystems formt. Diese Modelle können hinsichtlich ihrer Eignung zur Berücksichtigung mehrdimensionaler Strukturen bewertet werden. Hierfür wird in diesem Kapitel ein konkretes Bewertungsraster in Form mehrerer Kriterien entwickelt.
This is a preview of subscription content, log in via an institution.
Buying options
Tax calculation will be finalised at checkout
Purchases are for personal use only
Learn about institutional subscriptionsPreview
Unable to display preview. Download preview PDF.
Literatur
Der Begriff Business Intelligence, wie er 1989 von der Gartrier Group geprägt wurde, ist sehr eng gefasst und bezeichnet den Prozess der Transformation von Daten in Informationen sowie die Entdeckung weiterer Schlussfolgerungen aus diesen Informationen (Vgl. Behme/Mucksch (1997), S. 15). Meistens wird jedoch Business Intelligence nicht im Sinne dieses Prozesses, sondern ganz allgemein im Sinne eines Analytischen Informationssystems gesehen, d. h. einem System, bei dem die Analyse im Vordergrund steht (Vgl. Gluchowski et. al. (1997)).
Der Begriff der Optimierung wird dem allgemeinen Sprachgebrauch folgend in diesem Zusammenhang im Sinne einer Verbesserung benutzt und ist von dem mathematischen Begriff der Optimierung zu differenzieren.
Vgl. Gabriel/Dittmar (1999) für eine detaillierte Darstellung der TOPBIKE-Fallsrudie.
Vgl. hierzu z. B. McGuff (1998), Silverston/Inmon/Graziano (1997) sowie Golfarelli/Maio/Rizzi (1998).
Vgl. Gabriel/Gluchowski (1997), S. 24ff.
An dieser Stelle wird nur auf eine Dimension Bezug genommen, um nicht schon an dieser Stelle die gesamte Semantik des Anwendungsbeispiels mit aufbauen zu müssen.
Vgl. Hahne (1998), S.7.
Vgl. Gabriel/Gluchowski (1997), S.25.
Vgl. Schelp (1999), S. 285f.
In manchen Systemprodukten werden nur Baumstrukturen unterstützt, da der Dimensionsname selbst als oberster Knoten, die Wurzel des Baumes, definiert wird. Vgl. Hahne (1998), S. 27ff.
Ob dies in den semantischen Kontext passt, ist dabei eine andere Frage.
Unbalancierte bzw. unausgeglichene hierarchische Strukturen werden auch unter dem Begriff der Strukturanomalie gefasst. Vgl. Holthuis (1997), S. 145f.
Dies könnte etwa dann der Fall sein, wenn historische Daten nur auf Monatsebene oder gar nur auf Jahresebene vorliegen, die aktuellen Daten jedoch sehr viel granularer.
Vgl. Holthuis (1997), S. 155ff.
Vgl. Schelp (1999), S. 288.
In der Darstellung mehrdimensionaler Datenstrukturen in der Literatur spielen Attribute häufig eine eher untergeordnete Rolle. In Darstellungen, die auf den Einsatz relationaler Datenbanktechnik abzielen, wird hingegen betont, dass vernünftige und zahlreiche Attribute das Wesen eines mehrdimensionalen Modells ausmachen, vgl. Kimball (1996), S. 17f. Allerdings sind unter diesem Attributsbegriff ebenfalls Aggregatknoten in der Hierarchie mit zu fassen. Die praktische Relevanz von Attributen drückt sich in der zunehmenden Unterstützung vielfältiger Formen von Attributen in verfügbaren Systemprodukten aus, vgl. Hahne (1998).
Zur Gruppenbildung in Dimensionshierarchien vgl. Schelp (2000), S. 241ff.
Das Attribut (als Schema) ist dann für alle Dimensionselemente definiert, die Attribut-Ausprägungen der einzelnen Elemente können unterschiedlich sein.
Vgl. auch Abbildung 3.12.
Dieser Aspekt tangiert insofern die Schnittstelle vom konzeptionellen zum externen Schema. Zwischen der rein logischen Modellebene und dem externen Schema ist daher zu differenzieren.
Streng genommen ist eine nullstellige Operation der einfachste Fall, was jedoch an dieser Stelle hier keine Rolle spielt.
Vgl. Gabriel/Gluchowski (1997), S. 26.
Vgl. Gabriel/Gluchowski (1997), S. 21.
Meyer (1994), S. 1.
Bei OLAP-Datenbanken wird statt von Kennzahl oft von Variable gesprochen, vgl. Pilot Software (1995), S. 14f.
Vgl. Küting (1983).
Vgl. Reichmann (1997), S. 25.
Für eine umfangreiche Übersicht über Kennzahlen und Kennzahlensysteme vgl. Michel (1999).
Dies ist natürlich eine im allgemeinen nicht zu haltende Einschränkung an mehrdimensionale Datenmodelle.
Die Richtung der Pfeile ergibt sich aus der für Bäume üblichen Notation, da Kennzahlensysteme meistens vertikal statt horizontal notiert werden.
McGuff spricht in diesem Zusammenhang von informational dimension, vgl. McGuff (1996), S. 12ff.
Bei dieser Modellierungsvariante wird auch oft vom Hypercube-Ansatz gesprochen, da alle Kennzahlen in einem großen Würfel untergebracht sind.
Oftmals wird das Data Warehouse-Konzept mit dem Grundsatz verbunden, dass ein einmal vorhandener Wert nicht mehr verändert werden soll, damit gleiche Abfragen auf dem Data Warehouse-Datenbestand auch immer zu dem gleichen Berichtsergebnis führen. Ist eine Differenzierung zwischen der berichteten Periode und der Periode, in der berichtet wird, notwendig (z. B. wenn in einem Modell, welches die aktuellen Erfüllungsgrade und aufgelaufenen Iststunden sowie die Plansrunden für Projekte beinaltet), so kann dies über zwei Zeitdimensionen abgebildet werden, etwa die Dimensionen Zeit und Berichtszeit.
Vgl. u. a. Chawathe/Rajaraman/Garcia-Molina/Widom (1996) für einen Algorithmus speziell auf Basis hierarchischer Strukturen.
Vgl. beispielsweise Lenz/Shoshani (1997) sowie auch Gabriel/Gluchowski (1997).
Gabriel/Gluchowski (1997), S. 26.
Vgl. Shoshani (1997), S. 4f.
Zum Begriff der Additivität von Kennzahlen vgl. Kimball (1996), S.12f.
Dies wird insbesondere an Kennzahlen deutlich, die nur bezogen auf die Zeitdimension nicht additiv sind (es wird dann auch von semi-additiver Kennzahl gesprochen), wie etwa Bestandsgrößen. Daher wird oftmals die Zeitdimension gesondert gekennzeichnet, vgl. auch Hahne (1998).
Bei statistischen Datenbanken wird explizit differenziert zwischen micro-data, den Basisdaten, und macro-data, die die aggregierten Daten repräsentieren. Vgl. Shoshani (1997), S. 5.
Vgl. Lehner/Albrecht/Wedekind (1998), S. 2.
Ebenfalls auf physischer Modellebene ist die Diskussion der physischen Ablage oder dynamischen Kalkulation von Werten angesiedelt. Dies ist aber ein weiterer Aspekt von zu berücksichtigenden Regeln in mehrdimensionalen Datenmodellen, vgl. Gabriel/Gluchowski (1997), S. 27.
Rights and permissions
Copyright information
© 2002 Springer Fachmedien Wiesbaden
About this chapter
Cite this chapter
Hahne, M. (2002). Kriterien zur Bewertung der Eignung logischer Datenmodelle für die Abbildung mehrdimensionaler Datenstrukturen. In: Logische Modellierung mehrdimensionaler Datenbanksysteme. Deutscher Universitätsverlag, Wiesbaden. https://doi.org/10.1007/978-3-322-89790-9_3
Download citation
DOI: https://doi.org/10.1007/978-3-322-89790-9_3
Publisher Name: Deutscher Universitätsverlag, Wiesbaden
Print ISBN: 978-3-8244-2159-6
Online ISBN: 978-3-322-89790-9
eBook Packages: Springer Book Archive