Zusammenfassung
Um die Überprüfung der Einsatzmöglichkeiten von Data Mining zur Identifikation schwacher Signale im Rahmen der Technologiefrühaufklärung sowohl generell als auch am konkreten Beispiel zu ermöglichen, soll zunächst der bereits vorgestellte Data-Mining-Prozess mit seinen Phasen „Zielformulierung“, „Datenauswahl und -be-reitstellung“, „Datenbereinigung und -aufbereitung“, „Verfahrenswahl und Durchführung der Analyse“ und „Ergebnisaufbereitung“603 derart ausgestaltet werden, dass die TFA-spezifischen Aufgabenstellungen der Identifikationsphase erfüllt und die dabei festgelegten Anforderungen erfüllt werden können.
„Forecasting future events is often like searching for a black cat in an unlit room, that may not even be there.“
Steve Davidson
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Preview
Unable to display preview. Download preview PDF.
Literatur
Im allgemein gültigen Data-Mining-Prozess (siehe 4.1.3) beinhaltet die letzte Phase die Ergebnisaufbereitung und -Verwertung, davon ausgehend, dass es sich dabei um einen abgeschlossenen Prozess handelt. Im Rahmen der Technologiefrühaufklärung erfolgt die Ergebnisverwertung erst im Rahmen der nachfolgenden TFA-Phasen Analyse und Evaluation. In der hier betrachteten TFA-Identifikationsphase erfolgt daher lediglich die Ergebnisaufbereitung.
„Although a data-mining tool can indeed explore your data and uncover relationships, it still needs to be directed toward a specific goal.“ Small 1997. Siehe dazu auch die Diskussion um eine weite oder enge Abgrenzung des TFA-Beobachtungsbereichs (3.4.1) sowie um Data Mining als „hypothesenfreiem“ Suchen (4.1.2).
Für die folgenden Ausführungen wird zwischen Beobachtungsbereich und Suchraum unterschieden. TFA-Beobachtungsbereich ist dabei der gesamte, für das Unternehmen relevante Teil des Unternehmensumfelds, der den TFA-Aktivitäten zugrunde liegt (siehe auch 3.4.1). Dieser TFA-Beobachtungsbereich kann in verschiedene Segmente strukturiert sein. Mit Suchraum wird der Teil des TFA-Beobachtungsbereichs bezeichnet, in dem ausgehend von einer bestimmten TFA-Frage-Stellung und unter Anwendung einer bestimmten Suchstrategie tatsächlich nach schwachen Signalen gesucht wird. Der Suchraum kann folglich ein, mehrere oder alle Segmente des TFA-Beobachtungsbereichs umfassen.
Die hier aufgeführten Fragestellungen wurden aus der Literatur zum Thema Technologiemanagement sowie eigenen Überlegungen abgeleitet und in verschiedenen Gesprächen mit Praktikern auf ihre Relevanz überprüft und bestätigt.
Unter Killerapplikationen sollen hier Anwendungen verstanden werden, die auf einer bestimmten Technologie basieren und bisherige vergleichbare, aber auf einer anderen Technologie basierenden Anwendungen vom Markt verdrängen (Beispiel: die CD als Nachfolger der Schallplatte).
Strategie soll hier verstanden werden als Muster von Entscheidungen, Ansätzen und Verhaltensweisen, das einer proaktiven Ausrichtung einer Organisation auf zukünftige Bedingungen und Anforderungen dient; vgl. Zahn 1986, S. 19, Zahn 1991, S. 125
Siehe 5.2
Die beiden Ausprägungen „gering“ und „hoch“ entsprechen in verallgemeinerter Form den bereits weiter oben aufgeführten Ausprägungen „spezifisch“ und “breit” (Suchbreite) bzw. „oberflächlich“ und “detailliert” (Suchtiefe).
Zum Begriff des Mega-Trends und den verschiedenen Arten schwacher Signale siehe 3.4.2, insbesondere Abbildung 3–7 sowie die Ausführungen in Fußnote 467.
Siehe Tabelle 5–1
Siehe Tabelle 5–1
Siehe Tabelle 5–1
Siehe 5.4
Siehe 5.2
Siehe 3.4.1
Vgl. Gering 1995, S. 364
Beispiel für ein Klassifikationssystem ist die internationale Patentklassifikation (IPC), deren hierarchische Struktur auf Sektionen, Untersektionen, Klassen, Unterklassen, Hauptgruppen und Untergruppen verweist. Vgl. Wittmann, Greif 1989, S. 350
Vgl. vom Kolke 1996, S. 20ff., DIN 1987, S. 2ff., Scherff 1988, S. 8
Vgl. Gering 1995, S. 366, vom Kolke 1996, S. 8ff. u. 33
Unter einem Thesaurus versteht man einen Schlagwortkatalog mit einem alphabetischen Verzeichnis aller in der Datenbank gebundenen Schlagwörter (Deskriptoren) eines bestimmten Fachgebietes.
Beispiel ermittelt mit Hilfe des Thesaurus zur Datenbank INSPEC beim Datenbankanbieter OVID Technologies Inc. (Stand September 2000).
Für das Beispiel wurde die Datenbank INSPEC verwendet. Als Recherchefelder wurden neben Titel und Abstract die Datenfelder „Classification Codes“ (fest vorgegebenes Klassifizierungssystem der Datenbank), „Subject Headings“ (fest vorgegebene Schlagwortkategorien) und „Key Phrase Identifiers“ (frei wählbare Schlagwörter) herangezogen (Stand September 2000).
Vgl. Nakhaeizadeh et al. 1998, S. 6
Siehe 4.1.2
Beispielsweise werden „Auto“ und „Autos“ von Data-Mining-Tools grundsätzlich als zwei inhaltlich verschiedene Begriffe aufgefasst. Genauso werden bei irrtümlicher Verwendung eines anderen als des zu verwendenden Trennzeichens zwei Begriffe fälschlicherweise als ein Begriff angesehen (z.B. „Auto. Mofa“ als ein Wort anstelle der zwei Begriffe „Auto“ und „Mofa“).
Vgl. Krahl et al. 1998, S. 28. Eine ausführliche Aufstellung und Beschreibung verschiedener Mining- und KDD-Tools findet sich im Internet unter http://www.kdnuggets.com . Vgl. außerdem Krahl et al. 1998, S. 28f., Nakhaeizadeh et al.. 1998, S. 25f.
Siehe 5.2
Vgl. Dietz 1995, S. 67, Rothe 1986, S. 169ff.
Vgl. Dietz 1995, S. 67
Ebenfalls möglich ist der umgekehrte Weg, d.h. veraltete Deskriptoren werden im Rahmen der Datenpflege aus dem Katalog vorgegebener Deskriptoren entfernt. In der Praxis ist dieser Fall allerdings von untergeordneter Bedeutung, d.h. einmal in den Katalog aufgenommene Deskriptoren bleiben i.d.R. dort enthalten.
Siehe die in 5.1 vorgestellten Suchstrategietypen.
Die hier beschriebene Vorgehensweise dient als grobe Orientierung. Eine ausführlichere Darstellung einzelner Fallbeispiele erfolgt in Kapitel 6.
Die Homogenität eines Clusters gibt an, wie ähnlich sich die in diesem Cluster befindenden Objekte sind. Je höher der Homogenitätsgrad, desto einheitlicher ist das Cluster. Der Heterogenitätsgrad gibt dagegen an, wie stark unterschiedliche Cluster voneinander abgegrenzt sind. Je größer der Heterogen itätsgrad, umso verschiedener sind die einzelnen Cluster. Die meisten Data-Mining-Tools bieten Homogenitäts- und Heterogenitätsgrad oder ähnliche Maße an, um die Qualität der erzeugten Cluster zu beurteilen.
Siehe die Ausführungen zur Zipf-Verteilung in 3.4.3.
Unter Operationalisierung wird dabei die „Zuordnung von empirisch erfassbaren, zu beobachtenden oder zu erfragenden Indikatoren zu einem theoretischen Begriff“ verstanden. Atteslander 1995, S. 61
Siehe 3.3.2
Solche Data-Mining-Analysen wurden unter Mitwirkung des Verfassers im Rahmen eines Forschungsprojektes des Lehrstuhls F&E-Management der Universität Stuttgart in Zusammenarbeit mit der T-Nova Innovationsgesellschaft mbH der Deutschen Telekom anhand ausgewählter realer Fragestellungen durchgeführt.
Ein weiteres, damit zusammenhängendes Ziel ist die Formulierung und Überprüfung von Hypothesen; siehe 6.1 und 7.
Siehe die Ausführungen zur Beurteilung der Interessantheit von DaMi-Ergebnissen in 4.1.3. Bei dieser Beurteilung handelt es sich nicht um eine vorgezogene Analyse und Evaluation der Ergebnisse (dies erfolgt erst in den auf die Identifikation folgenden TFA-Phasen). An dieser Stelle wird lediglich versucht, grob abzuschätzen, wie nützlich die gewonnenen Informationen für die untersuchte Fragestellung sind und ob sich eine weitere Analyse und Evaluation lohnt.
Siehe 4.1.3
Rights and permissions
Copyright information
© 2003 Deutscher Universitäts-Verlag/GWV Fachverlage GmbH, Wiesbaden
About this chapter
Cite this chapter
Zeller, A. (2003). TFA-gerechte Ausgestaltung des Data-Mining-Prozesses. In: Technologiefrühaufklärung mit Data Mining. Forschungs-/Entwicklungs-/Innovations-Management. Deutscher Universitätsverlag. https://doi.org/10.1007/978-3-322-81586-6_5
Download citation
DOI: https://doi.org/10.1007/978-3-322-81586-6_5
Publisher Name: Deutscher Universitätsverlag
Print ISBN: 978-3-8244-7914-6
Online ISBN: 978-3-322-81586-6
eBook Packages: Springer Book Archive