Skip to main content

Datenanalyse: On-Line Analytical Processing und Data Mining

  • Chapter
Management Support Systeme und Business Intelligence
  • 18k Accesses

Auszug

Data Warehouse-Lösungen verfolgen das Ziel, einen logisch zentralen, einheitlichen und konsistenten Datenbestand aufzubauen, der als Grundlage unterschiedlicher Ansätze zur Entscheidungsunterstützung in einer Unternehmung fungieren kann.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Chapter
USD 29.95
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
eBook
USD 39.99
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
Softcover Book
USD 84.99
Price excludes VAT (USA)
  • Compact, lightweight edition
  • Dispatched in 3 to 5 business days
  • Free shipping worldwide - see info

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

Literatur

  1. Aus diesem Grunde wird das OLAP-Konzept gar als historischer Nachfolger des Ansatzes hierarchischer Kennzahlensysteme verstanden. Vgl. Hofacker (1999), S. 60.

    Google Scholar 

  2. Vgl. Codd/Codd/Salley (1993); Codd (1994).

    Google Scholar 

  3. Vgl. Franconi/Baader/Sattler/Vassiliasis (2000), S. 88.

    Google Scholar 

  4. Als besondere Anekdote der DV-Geschichte ist der Umstand zu verstehen, dass es mit E. F. Codd einer der geistigen Urväter der relationalen Datenbanksysteme war, der den Begriff des On-Line Analytical Processing prägte. Vgl. Gluchowski/Chamoni (2006), S. 145. Unbestritten erweisen sich operative, transaktionsorientierte Anwendungssysteme auf der Basis relationaler Datenbanktechnologie als stabile, sichere und schnelle Lösungen. Allerdings offenbaren diese Systeme Schwächen bei der flexiblen und benutzeradäquaten Zurverfügungstellung entscheidungsrelevanter Informationen. Schließlich, so argumentiert Codd, sind relationale Systeme auch nicht darauf ausgelegt, multidimensionale Analysen mit der geforderten Funktionalität und in der gewünschten Schnelligkeit zu gewährleisten. Vgl. Codd/Codd/Salley (1993).

    Google Scholar 

  5. Vgl. Jahnke/Groffmann/Kruppa (1996), S. 321.

    Google Scholar 

  6. Vgl. Holthuis (1998), S. 52.

    Google Scholar 

  7. Vgl. Jahnke/Groffmann/Kruppa (1996), S. 321; Holthuis (1998), S. 55.

    Google Scholar 

  8. Vgl. Werner (1995), S. 45.

    Google Scholar 

  9. Vgl. Clausen (1998), S. 14; Pendse/Creeth (1995); Reinke/Schuster (1999), S. 46.

    Google Scholar 

  10. Vgl. Leitner (1997), S. 44.

    Google Scholar 

  11. Vgl. Clausen (1998), S. 44.

    Google Scholar 

  12. Vgl. Thomsen (1997), S. XIXf.; Oehler (2006), S. 25.

    Google Scholar 

  13. Vgl. Pendse (2002).

    Google Scholar 

  14. Vgl. Thomsen (1997), S. XXI.

    Google Scholar 

  15. Vgl. Oehler (2006), S. 25.

    Google Scholar 

  16. Hinsichtlich des Datenvolumens existieren allerdings inzwischen Durchgriffsmöglichkeiten auf Datenbankserver, so etwa im Microsoft-Bereich auf die Analysis Services des SQL-Server 2005. Die Tabellenkalkulationsprogramme werden dann als reines Anzeigemedium und nicht als Speicherkomponente genutzt. Vgl. Pendse (2002).

    Google Scholar 

  17. Vgl. Oehler (2006), S. 25.

    Google Scholar 

  18. Vgl Thomsen (1997), S. XIX.

    Google Scholar 

  19. Vgl. Saylor/Bedell/Rodenberger (1997), S. 39.

    Google Scholar 

  20. Vgl. Totok (2000b), S. 87; Schelp (2000), S. 140.

    Google Scholar 

  21. Bauer und Günzel definieren Granularität als Stufe des Verdichtungsgrades von Daten. Vgl. Bauer/Günzel (2004), S. 528. Siehe auch Mucksch (1999), S. 177; Kemper/Finger (2006), S. 116.

    Google Scholar 

  22. Vgl. Oehler (2006), S. 136ff.

    Google Scholar 

  23. Entsprechend der gewählten Begrifflichkeit des Hierarchiebaumes werden die Basiselemente auch als Blätter und das Element auf der obersten Ebene als Wurzel bezeichnet. Vgl. Totok (2000b), S. 92f.

    Google Scholar 

  24. So unterscheidet Holthuis zwischen nichthierarchischen, hierarchischen und kategorischen Dimensionen. Vgl. Holthuis (1998), S. 121–125. Mit ausgeprägtem Bezug zur relationalen Implementierung grenzt Thomsen dagegen Identifikator-von Variablen-Dimensionen ab. Vgl. Thomsen (1997), S. 424–431.

    Google Scholar 

  25. In Abgrenzung zur Hierarchiebildung werden Auswertungen auf derartigen Attributen dann auch als vertikale Analysen benannt. Vgl. Oehler (2006), S. 143.

    Google Scholar 

  26. Vgl. Holthuis (1998), S. 186.

    Google Scholar 

  27. Als alternative Metapher zur Abbildung mehrdimensional strukturierter Daten lässt sich beispielsweise auch eine Rechenschieberdarstellung wählen. Vgl. Back-Hock (1993c), S. 267.

    Google Scholar 

  28. Vgl. Oehler (2006), S. 127.

    Google Scholar 

  29. Vgl. Holthuis (2000), S. 174.

    Google Scholar 

  30. Zusätzlich finden sich auch die Begriffsgebilde nicht-hierarchische Dimension und partitioning dimension als Bezeichnung für eine derartig strukturlose Dimension. Vgl. Holthuis (1998), S. 121f.

    Google Scholar 

  31. Holten und Knackstedt zeigen für eine Artikeldimension acht alternative Wege zur Gruppierung von Einzelartikeln auf. Vgl. Holten/Knackstedt (1999), S. 11.

    Google Scholar 

  32. Vgl. Totok (2000b), S. 93.

    Google Scholar 

  33. Vgl. Oehler (2006), S. 138.

    Google Scholar 

  34. Schelp diskutiert diesen Sonderfall unter dem Begriff Heterarchie. Vgl. Schelp (2000), S. 142f.

    Google Scholar 

  35. Vgl. Oehler (2006), S. 139f.

    Google Scholar 

  36. Vgl. Lehmann (2001), S. 38.

    Google Scholar 

  37. Vgl. Kimball (1996), S. 49.

    Google Scholar 

  38. Die Behandlung von zeitlichen Strukturbrüchen innerhalb einzelner Dimensionen ist ein nicht zu unterschätzendes Phänomen, für das vielfältige Lösungsmöglichkeiten existieren. So unterbreiten beispielsweise Chamoni und Stock einen Vorschlag zum Einsatz von Zeitstempeln für die Verwaltung von Änderungen in den Dimensionsstrukturen. Vgl. Chamoni/Stock (1998), S. 516–519.

    Google Scholar 

  39. Vgl. Lehmann (2001), S. 37.

    Google Scholar 

  40. Vgl. Saylor/Bedell/Rodenberger (1997), S. 39.

    Google Scholar 

  41. Teilweise wird hier zwischen informations-, analyse-, planungs-und kampagnenorientierten Einsatzbereichen explizit unterschieden. Vgl. Bauer/Günzel (2004), S. 13. Schinzer, Bange und Mertens identifizieren darüber hinaus auch noch die einzelfallorientierte Nutzung multidimensionaler Datenbestände als besonderen Einsatzbereich. Vgl. Schinzer/Bange/Mertens (2000), S. 12.

    Google Scholar 

  42. Vgl. Hannig/Hahn (2002), S. 224. Zwar werden hier Business Intelligence-Lösungen allgemein abgetragen, allerdings ist davon auszugehen, dass es sich zu einem Großteil dabei um multidimensionale Systeme handelt.

    Google Scholar 

  43. Brändli (1997), S. 12.

    Google Scholar 

  44. Vgl. Mentzl/Ludwig (1998), S. 479.

    Google Scholar 

  45. Vgl. Oehler (2006), S. 296ff.

    Google Scholar 

  46. Vgl. Gregorzik (2002), S. 49–51.

    Google Scholar 

  47. Oehler führt zudem die Zahlungsstromrechnung, die Konsolidierung und speziell die Prozesskostenrechnung als Anwendungsfelder für multidimensionale Informationssysteme auf. Überdies beschreibt er den multidimensionalen Aufbau einer Balanced Scorecard-Lösung. Vgl. Oehler (2006), S. 226–272. Bauer und Günzel verweisen auf Einsatzfelder, die sich auch außerhalb betriebswirtschaftlicher Betrachtungen im Bereich der empirischen Messdatenerfassung finden lassen. Vgl. Bauer/Günzel (2004), S. 484ff.

    Google Scholar 

  48. Vgl. Siegwart (1992), S. 26; Oehler (2006), S. 59.

    Google Scholar 

  49. Derartige Systemlösungen werden auch als hybrid bezeichnet. Vgl. Bauer/Günzel (2004), S. 242; Clausen (1998), S. 35; Kurz (1999), S. 326.

    Google Scholar 

  50. Vgl. Behme/Holthuis/Mucksch (2000), S. 216; Finkelstein (1995); Thomsen (1997), S. 207. Zur exakten Abgrenzung bezeichnet Holthuis die Vertreter dieser Systemkategorie als physisch multidimensionale Datenbanksysteme. Vgl. Holthuis (1998), S. 186. Als charakteristisch erweist sich, dass multidimensionale Datenbanksysteme die Daten physikalisch in Arrays speichern. Vgl. Franconi/Baader/Sattler/Vassiliasis (2000), S. 96.

    Google Scholar 

  51. Vgl. Gluchowski (1998a), S. 12.

    Google Scholar 

  52. Vgl. Bauer/Günzel (2004), S. 241; Grandy (2002), S. 23.

    Google Scholar 

  53. Vgl. Clausen (1998), S. 33; Kurz (1999), S. 330; Leitner (1997), S. 43–46; Martin (1996).

    Google Scholar 

  54. Vgl. Gabriel/Röhrs (1995), S. 114ff., und die Ausführungen in Abschnitt 4.2.1.

    Google Scholar 

  55. Als wegweisend werden in diesem Zusammenhang die frühen Arbeiten von Edgar F. Codd gewertet. Vgl. z. B. Codd (1970), S. 377–387.

    Google Scholar 

  56. Vgl. Codd/Codd/Salley (1993).

    Google Scholar 

  57. Vgl. Gabriel/Röhrs (2003), S. 58ff.

    Google Scholar 

  58. Vgl. Kurz (1999), S. 330.

    Google Scholar 

  59. Als typische Anwender einer multidimensionalen Lösung lassen sich neben den Benutzern in leitender Position gelegentliche User, Geschäftsanalytiker, Daueranwender und Anwendungsentwickler identifizieren. Vgl. Poe/Reeves (1997), S. 172f. Bereits in Abschnitt 4.3 wurden verschiedene Nutzergruppen beschrieben, von denen sich als typische OLAP-Anwender insbesondere die Analytiker identifizieren lassen.

    Google Scholar 

  60. Martin unterscheidet zwischen vorgefertigten, explorativen und interaktiven Analyseformen. Vgl. Martin (1998a), S. 32.

    Google Scholar 

  61. Vgl. Wieken (1999), S. 40. Als typische Anwender lassen sich hier die Spezialisten anführen (vgl. Abschnitt 4.3).

    Google Scholar 

  62. Clausen bezeichnet diese Tools als Ad-Hoc-Analysewerkzeuge. Vgl. Clausen (1998), S. 142.

    Google Scholar 

  63. Vgl. Oehler (2006), S. 64. Eine praktische Anleitung zur Verknüpfung von multidimensionalen Datenbeständen mit Spreadsheet-Technologie findet sich bei Reinke/Schuster (1999), S. 143–173.

    Google Scholar 

  64. Vgl. Bauer/Günzel (2004), S. 127–131; Clausen (1998), S. 128–138; Kurz (1999), S. 115f.; Kemper/Mehanna/Unger (2004), S. 132ff.; Wieken (1999), S. 90–92.

    Google Scholar 

  65. Aufgrund der bisweilen sensiblen Dateninhalte ist bei einer Übertragung via Internet-Technologie sehr genau auf die Gewährleistung eines sicheren, möglichst verschlüsselten Transfers zu achten. Vgl. Gartner (1997), S. 63.

    Google Scholar 

  66. Vgl. Lux (2005), S. 17.

    Google Scholar 

  67. Vgl. Berson/Smith (1997), S. 233f.; Piemonte (1997), S. 10.

    Google Scholar 

  68. Vgl. Vlamis (1996), S. 28–31.

    Google Scholar 

  69. Vgl. Microsoft (2007).

    Google Scholar 

  70. Vgl. Brosius (1999), S. 15; Oehler (2006), S. 93–100.

    Google Scholar 

  71. Vgl. Reinke/Schuster (1999), S. 216f.

    Google Scholar 

  72. Vgl. Spofford (2001).

    Google Scholar 

  73. Eine ausführliche Beschreibung des gesamten Sprachumfangs findet sich z. B. bei Spofford. Vgl. Spofford (2001).

    Google Scholar 

  74. Vgl. Chamoni/Gluchowski (2006), S. 16f.

    Google Scholar 

  75. Vgl. Bissantz (1999), S. 376.

    Google Scholar 

  76. Vgl. Bissantz/Hagedorn (1997), S. 104.

    Google Scholar 

  77. Vgl. Düsing (2006), S. 243f.

    Google Scholar 

  78. Zum Begriff der aktiven Informationssysteme vgl. Bissantz (1999), S. 376f

    Google Scholar 

  79. Vgl. Fayyad/Piatetsky-Shapiro/Smyth (1996).

    Google Scholar 

  80. Vgl. Adriaans/Zantinge (1998).

    Google Scholar 

  81. Vgl. Fayyad/Piatetsky-Shapiro/Smyth (1996), S. 6.

    Google Scholar 

  82. Vgl. Bissantz/Hagedorn (1993), S. 481.

    Google Scholar 

  83. Vgl. Düsing (2006), S. 246.

    Google Scholar 

  84. Einen Überblick hierzu bietet Soeffky (1998), S. C833.07 ff.

    Google Scholar 

  85. Vgl. Krahl/Windheuser/Zick (1998), S. 106f.

    Google Scholar 

  86. Vgl. Petersohn (2005), S. 12–14.

    Google Scholar 

  87. Vgl. Gluchowski (2000), S. 12f.; Schommer/Müller (2001), S. 59ff., und Abschnitt 8.4.

    Google Scholar 

  88. Vgl. Gerst/Herdweck/Kuhn (2001), S. 38. Einen Überblick über die gebräuchlichen Verfahren und Anwendungsgebiete von Text Mining liefert Felden (2006), S. 283 — 304.

    Google Scholar 

  89. Eine breite Palette unterschiedlicher Verfahren lässt sich nutzen, um vorhandene Datenbestände im Sinne des Data Mining zu analysieren. Übersichten über die einsetzbaren Methoden bieten z. B. Beekmann/Chamoni (2006), S. 263–282; Krahl/Windheuser/Zick (1998), S. 59–95; Schweizer (1999), S. 57–62.

    Google Scholar 

  90. Vgl. Degen (2006), S. 311 und 320.

    Google Scholar 

  91. Vgl. Beekmann/Chamoni (2006), S. 274.

    Google Scholar 

  92. Vgl. Bankhofer (2004), S. 399.

    Google Scholar 

  93. Vgl. Poddig/Sidorovich (2001), S. 373.

    Google Scholar 

  94. Vgl. Rehkugler/Zimmermann (1994); Schöneburg/Straub (1993), S. 247ff.

    Google Scholar 

  95. Vgl. Laudon/Laudon/Schoder (2006), S. 482 f.

    Google Scholar 

  96. Vgl. Neckel/Knobloch (2005), S. 222f.

    Google Scholar 

  97. Vgl. Hettich/Hippner/Wilde (2000), S. 977; Krahl/Windheuser/Zick (1998), S. 140.

    Google Scholar 

  98. Vgl. hierzu das Beispiel einer Assoziationsanalyse in Bodendorf (2006), S. 47 ff.

    Google Scholar 

  99. In Anlehnung an: Hettich/Hippner/Wilde (2000), S. 970.

    Google Scholar 

  100. Eine Erläuterung dieses Verfahrens bieten beispielsweise Hettich und Hippner. Vgl. Hettich/Hippner (2001), S. 429ff.

    Google Scholar 

  101. Vgl. Krahl/Windheuser/Zick (1998).

    Google Scholar 

  102. Vgl. Beekmann/Stock/Chamoni (2003), S. 1531 ff.

    Google Scholar 

Download references

Rights and permissions

Reprints and permissions

Copyright information

© 2008 Springer-Verlag Berlin Heidelberg

About this chapter

Cite this chapter

(2008). Datenanalyse: On-Line Analytical Processing und Data Mining. In: Management Support Systeme und Business Intelligence. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-540-68269-1_6

Download citation

  • DOI: https://doi.org/10.1007/978-3-540-68269-1_6

  • Publisher Name: Springer, Berlin, Heidelberg

  • Print ISBN: 978-3-540-23543-9

  • Online ISBN: 978-3-540-68269-1

  • eBook Packages: Business and Economics (German Language)

Publish with us

Policies and ethics