Advertisement

Datenmanagement

  • Stefan Voß
  • Kai Gutenschwager

Zusammenfassung

Unter Datenmanagement versteht man die Beschaffung und Bereitstellung (unternehmensinterner) Daten (für Informationssysteme) zur Aufgabenerfüllung und Entscheidungsunterstützung. Ausgehend von dieser allgemeinen Definition lassen sich zwei Anforderungen aus Sicht des Informationsmanagements formulieren. Zum einen ist dafür zu sorgen, alle relevanten Informationen im Unternehmen zu speichern, zum anderen muß der (einfache) Zugriff gewährleistet sein. Die sich aus der ersten Forderung ergebende Masse an Daten führt oftmals zu einer Informationsproliferation. Dieser ist mit Werkzeugen für eine “intelligente” Selektion zu begegnen. Neben der Vollständigkeit und der Qualität der Daten ist ein Ziel des Datenmanagements — vor allem im Bereich Controlling — die Wirtschaftlichkeit der Informationsbeschaffung; vgl. Steinbichler (1990), S. 144.

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

Literatur

  1. 1.
    Die mathematische Grundlage relationaler Datenbanken bildet die Relationenalgebra. Ist (A1,…,Am) eine Folge von Attributen mit den Wertebereichen dom(Ai), 1 ≤ im, so ist eine Relation r eine Teilmenge des Kartesischen Produkts dieser Domänen. Anschaulich kann eine Relation als Tabelle dargestellt werden, wobei für jedes Attribut eine Spalte existiert. Ein Tupel entspricht dann einem Zeileneintrag der Tabelle (Ausprägung). Die Operationen der Relationenalgebra ermöglichen mengenorientierte Anfragen an entsprechende Tabellen bzw. Datenbanken. Anfragen entsprechen dabei algebraischen Operationen auf Relationen, die sich in Manipulations-Operationen (manipulieren Mengen von Tupeln, ohne die Tupel selbst zu verändern, z.B. Durchschnitt oder Vereinigung) und Filter (iterieren über eine gegebene Menge von Tupeln, um Teilmengen gemäß des Erfülltseins bestimmter Bedingungen zu testen, z.B. Selektion oder Projektion). Zu einer Einführung in die Relationenalgebra wird auf Vossen (2000) verwiesen.Google Scholar
  2. 2.
    Für Agentensysteme findet sich in der Literatur keine allgemein gültige Definition, eine Einschränkung auf Softwaresysteme erscheint aber sinnvoll. Den meisten Ansätzen liegt darüber hinaus der Gedanke zugrunde, daß mit dem Agentenbegriff Eigenschaften wie Intelligenz und Autonomie verbunden werden. Agentensysteme können durch eine entsprechende Programmierung komplexe Aufgaben im Rahmen des Information Retrieval erfüllen. Das System Apple Data Detectors unterstützt z.B. Benutzer bei der Suche nach Telefonnummern, Namen, Besprechungsräumen etc. Hier kommen linguistische Verfahren zur Anwendung, wie sie in Kap. 7.5 vorgestellt werden; vgl. Nardi et al. (1998). Der wesentliche Ursprung der Agentensysteme entstammt der (verteilten) Künstlichen Intelligenz, bei der die Lösung von Problemen auch mittels Multi-Agentensystemen propagiert wird, die sich in Abgrenzung zu Modulen eines verteilten Problemlösers durch individuelle Ziele auszeichnen, wobei i.d.R. eine Koordination kooperierender Agenten durch wechselseitige Abstimmung ihrer lokalen Aktivitäten erforderlich ist; vgl. z.B. Klusch und Benn (1998), Müller (1993) sowie Sondergeld und Voß (1999).Google Scholar
  3. 4.
    Vgl. z.B. Myrach (1994) für eine weitergehende Begriffsbestimmung sowie eine empirische Untersuchung über die betriebliche Nutzung von Data Dictionaries.Google Scholar
  4. 5.
    Das Supply Chain Management beschreibt die prozeßorientierte Entwicklung, Gestaltung, Koordination und Steuerung aller Aktivitäten entlang der logistischen Kette; vgl. z.B. Cooper et al. (1997). Das Supply Chain Management setzt sich somit mit dem Beziehungsgeflecht der logistischen Kette (Beschaffung — Transport — Produktion — Distribution / Allokation / Transport — Absatz) auseinander.Google Scholar
  5. 6.
    Chamoni und Gluchowski (1999) fassen unter dem Begriff Analytische Informationssysteme eine Klasse von Konzepten zusammen, die sich primär aus dem Data Warehouse-und OLAP-Konzept sowie Werkzeugen aus dem Bereich des Data Mining zusammensetzen. Die Autoren definieren sie als das logische Komplement zu den Transaktionssystemen. Analytische Informationssysteme dienen primär der Informationsversorgung betrieblicher Fach-und Führungskräfte und sind damit in einen Kontext mit Executive Information-Systemen und insbesondere den Decision Support-Systemen zu stellen; vgl. hierzu Kap. 8.1 sowie Gabriel (1999). Neben klassischen Unterstützungsleistungen für das Management, wie z.B. in den Bereichen des Vertriebs-und Konzerncontrolling, ist auch das Direct Marketing als Anwendungsgebiet zu nennen. Auf Basis von Kunden-und Marktanalysen wird beim Direct Marketing der Ansatz eines Teilindividualmarketing verfolgt, d.h. den richtigen Kunden ist zum richtigen Zeitpunkt mit den richtigen Argumenten ein Informations-oder Leistungsangebot zu unterbreiten; vgl. hierzu Gabriel et al. (2000) sowie Dallmer (1997).Google Scholar
  6. 7.
    Verbund-bzw. Join-Operationen werden benötigt, um Tabellen einer Datenbank miteinander zu verbinden. Der Verbund (Join) verknüpft Tabellen über gleiche Spalten, indem er jeweils zwei Tupel (horizontal) miteinander verschmilzt, sofern sie in den entsprechenden Zeilen identische Einträge aufweisen; vgl. Heuer und Saake (1995).Google Scholar
  7. 8.
    Der Begriff “Data Warehouse” wurde erstmals von Devlin und Murphy (1988) benutzt. Als geistiger Vater des Konzepts gilt aber Inmon (1996).Google Scholar
  8. 9.
    Eine Optimierung der Zugriffszeiten kann neben der Fragmentierung der Datenbank durch Denormalisierung großer Datenbestände (in relationalen Datenbanksystemen) erreicht werden. Die Normalisierung eines Datenbankschemas dient der Vermeidung von Datenredundanz, die aufgrund von funktionalen Abhängigkeiten innerhalb von Relationen entstehen kann. Die Normalformen drücken idealisiert die Güte eines Datenbankschemas aus; vgl. z.B. Heuer und Saake (1995). Die Denormalisierung verringert die Güte eines Schemas und kann Datenredundanz erzeugen, reduziert aber gleichzeitig die Anzahl notwendiger, rechenzeitintensiver Verbundoperationen. Der Aspekt der Redundanz kann in Data Warehouse-Anwendungen aufgrund des nur lesenden Zugriffs der Endbenutzer zudem vernachlässigt werden. Auch die Ausgestaltung der Verdichtung der abgelegten Daten (Granularität), z.B. Zeit als Verdichtungskriterium, kann die Antwortzeiten deutlich beeinflussen. Es stellt sich dann das Problem, welche Daten detailliert erhalten bleiben sollten. Diese Fragestellung gehört aber nicht in den Bereich des Datenmanagements, sondern sollte innerhalb der Informationsbedarfsanalyse geklärt werden.Google Scholar
  9. 10.
    Star-Query bildet hier einen Ansatz; vgl. Gluchowski (1998).Google Scholar
  10. 12.
    Die Datenversorgung der Data Marts erfolgt dann unmittelbar aus den operativen Systemen, wobei Schnitt Stellenprobleme aufgrund der dezentralen Architektur auftreten können. Einen möglichen Mittelweg bietet eine logisch zentralisierte Schnittstelle, die die Versorgung der einzelnen Data Marts koordiniert und die Datenkonsistenz garantiert; vgl. Gabriel et al. (2000).Google Scholar
  11. 13.
    QBE ist im Gegensatz zu SQL keine textuelle Sprache. Statt dessen werden Anfragen durch Beispieleinträge in Tabellengerüsten formuliert. Eine spezielle Rolle kommt dabei Kontrolleinträgen zu, welche die Werte für die Ausgabe spezifizieren, z.B. P. für Print, logischen Operatoren (and, or, not) sowie Vergleichsoperatoren wie z.B. =, < oder ≥. Eine Einführung in QBE findet sich bei Heuer und Saake (1995).Google Scholar
  12. 14.
    Für multidimensionale Abfragesprachen exisitiert momentan kein Standard. Neuere Entwicklungen sind z.B. die Cube-Query-Language von Bauer und Lehner (1997) oder OLE DB for OLAP von Microsoft (1999).Google Scholar
  13. 17.
    Marktübersichten finden sich z.B. bei Pendse (1999a) sowie Schinzer et al. (1997).Google Scholar
  14. 18.
    Vgl. hierzu die Ausführungen in Kap. 6.2.2 und 6.2.3 sowie Kampffmeyer und Merkel (1997).Google Scholar
  15. 19.
    Vgl. z.B. Gulbins et al. (1999) sowie Altenhofen und Petrovic (1998) für eine Studie des Fraunhofer Instituts für Arbeits wir tschaft und Organisation, die zu dem Ergebnis kommt, daß eine Vielzahl der Anbieter von Dokumentenmanagementsystemen aus strategischen Gründen ihr Produkt mit mehr oder weniger mächtigen Workflow-Komponenten ausstattet.Google Scholar
  16. 20.
    Stahlknecht und Hasenkamp (1999) grenzen in diesem Zusammenhang Text Retrieval-Systeme von DMS ab, deren primärer Anwendungsbereich in der Verwaltung nicht-kodierter Informationen in Form von Image-Daten gesehen wird.Google Scholar
  17. 24.
    Bielawski und Boyle (1997) sprechen in diesem Zusammenhang von einem Paradigmenwechsel. Die Bezeichnung EDMS wird allerdings auch von DMS-Anbietern wie Documentum verwendet, um auszudrücken, daß ihr System alle Bedürfnisse eines Unternehmens bezüglich der Handhabung von Dokumenten befriedigt.Google Scholar
  18. 26.
    Eine aktuelle Übersicht zum Information Retrieval aus Dokumenten geben Mitra und Chaudhuri (2000).Google Scholar
  19. 28.
    So weist Park (1994) daraufhin, daß die als individuell zu betrachtende Relevanz eines Dokuments neben einer inhaltlichen Zugehörigkeit zur Fragestellung von weiteren Faktoren abhängig ist, wie z.B. der Autorenname, seine Zugehörigkeit zu bestimmten Institutionen, der Name der Quelle, z.B. eines wissenschaftlichen Journals, oder der Typ der Publikation. Es sollte daher die Möglichkeit bestehen, auch diese individuell unterschiedlichen Faktoren — abweichend von einem streng rational ausgerichteten Retrieval-Paradigma — explizit im Suchprozeß zu berücksichtigen.Google Scholar
  20. 32.
    Durch diese Vorgehensweise kann eine benutzerorientierte Indexierung ansatzweise erfolgen, die individuelle oder gruppenspezifische Informationsbedarfe explizit berücksichtigt. Ein entsprechendes, umfangreiches, begriffsorientiertes, automatisches Indexierungs-und Retrieval-System entstand in den 80er Jahren für das Fachinformationszentrum Karlsruhe in den Bereichen Physik, Luft-und Raumfahrttechnik sowie Mathematik; vgl. Lück et al. (1992).Google Scholar
  21. 33.
    Zu Möglichkeiten der Wissensrepräsentation wird auf Kap. 8.3 verwiesen. Ein Ansatz zur Inhaltserschließung über eine Klassifikation von Dokumenten wird in Abschnitt 7.5.5 behandelt. Zu weiteren begriffsorientierten Ansätzen der Indexierung wird auf Knorz (1994) verwiesen.Google Scholar
  22. 37.
    Die Ausführungen dieses Abschnitts basieren weitestgehend auf Wätjen et al. (1998).Google Scholar
  23. 43.
    Zu den folgenden Ausführungen in diesem Abschnitt wird insbesondere auf Voß und Domschke (1999) und ferner auf Daduna und Streit (1998) sowie Schneidereit und Voß (1998) verwiesen.Google Scholar

Copyright information

© Springer-Verlag Berlin Heidelberg 2001

Authors and Affiliations

  • Stefan Voß
    • 1
  • Kai Gutenschwager
    • 1
  1. 1.Institut für Wirtschaftswissenschaften, Abt. Allg. BWL, Wirtschaftsinformatik u. InformationsmanagementTechnische Universität BraunschweigBraunschweig

Personalised recommendations