Zusammenfassung
Lassen Sie uns in die Übersicht über die verschiedenen Grade der semantischen Informationserschließung mit einer Vorstufe semantischer Netze einsteigen, dem Tagging von Informationen. Tags sind Schlagworte , mit denen beliebige Objekte charakterisiert werden können. Tags sind nichts grundsätzlich Neues, wir kennen sie als Teil einer klassischen Kombination aus jeder Bibliothek.1 Hier sind die Bücher nach einer Aufstellungssystematik in Regale (= in Ordner) eingeordnet, daneben aber auch in einem Schlagwortkatalog verzeichnet (= mit Tags versehen). Diese Schlagworte werden entweder vom Verlag vorgeschlagen oder von einem Mitarbeiter der Bibliothek vergeben, der das Buch gelesen oder mindesten überflogen hat; als Dienstleistung für die Nutzer der Bibliothek.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Notes
- 1.
Es ist im Übrigen bemerkenswert, wie selten Techniken, die sich seit Jahrzehnten in der Dokumentation und Bibliothekswesen bewährt haben, im Bereich Knowledge-Management Beachtung finden. Eine mögliche Erklärung könnte in der schwachen Position der Bibliothekswissenschaften als Wissenschaftsdisziplin liegen (siehe auch Simon 2004).
- 2.
- 3.
Der Vergleich wird in der Praxis nicht mit allen Wörtern aller Dokumente durchgeführt – welche Auswahl in den Vergleich mit einbezogen wird, ist das Geschäftsgeheimnis der verschiedenen Clustering-Verfahren am Markt.
- 4.
Siehe z.B. Mao (2006).
- 5.
Das Beispiel wurde im April 2009 mit der clustering engine clusty (http://www.clusty.com) durch die Eingabe des Suchbegriffs „espresso machine“ generiert. Wie oben erwähnt, gibt es viele Cluster-Verfahren; andere Verfahren werden für dieses Beispiel andere Ergebnisse liefern. Mit diesem Beispiel und im Rahmen dieses Kompendiums können wir unmöglich allen Verfahren gerecht werden. Wir haben uns bei den Schwierigkeiten und Grenzen automatischer Verfahren, die wir im Folgenden aufführen, auf die Punkte konzentriert, die grundsätzlicher Natur sind und bei allen Verfahren auftreten werden, die semantische Netze rein aus Dokumentbeständen heraus aufbauen.
- 6.
Es ist leicht vorstellbar, wie es dazu kommt: Nur in Texten, in denen es um beide Gerätetypen geht, besteht auch ein großer Bedarf nach sprachlicher Abgrenzung, also werden sie auch nur in diesen Texten häufig explizit genannt werden: „in diesem Absatz geht es um home espresso machines, jenes Feature gibt es nur bei commercial machines usw“. D.h. gerade Begriffe, die Gegensätze oder verschiedene Fälle voneinander abgrenzen, kommen oft zusammen vor und werden in der Clusteranalyse zusammengeworfen.
- 7.
Eine der etabliertesten Strategien der Extraktion von Objekten und Fakten aus unstrukturierten Texten. Siehe (Rostek 1979).
- 8.
An eine Oberbegriffsrelation haben wir strenge Anforderungen (siehe Abschn. 5.1), die wir bei assoziativen Netzen nicht anlegen können.
Literatur
Barbosa D. (2008) Taxonomy Folksonomy Cookbook. Dow Jones, New York. Verfügbar unter: http://solutions.dowjones.com/cookbook/ebook_sla2008/cookbookebook.pdf (25.9.2009)
Faatz A (2004) Ein Verfahren zur Anreicherung fachgebietsspezifischer Ontologien durch Begriffsvorschläge. Dissertation, TU-Darmstadt. Verfügbar unter: http://elib.tu-darmstadt.de/diss/000505/diss_deutsch.pdf (2.5.2009)
Faatz A, Steinmetz A (2004) Ontology Enrichment Evaluation. In: Motta E, Shadbolt N, Stutt A, Gibbins N (Hrsg) Engineering Knowledge in the Age of the SemanticWeb. Springer, Heidelberg
Manning CD, Schütze H (1999) Foundations of Statistical Natural Language Processing. MIT Press, Cambridge
Mao J (2006) US Patent 7031909 – Method and System for Naming a Cluster of Words and Phrases
Rostek L (1979) Methoden des partiellen Parsings für das automatische Indexing – Syntaxgraphen zur Analyse von Sprachmustern. In: Kuhlen R (Hrsg) Datenbasen – Datenbanken – Netzwerke. Praxis des Information Retrieval. Saur, München
Simon T (2004) Die Positionierung einer Universitäts- und Hochschulbibliothek in der Wissensgesellschaft: eine bibliothekspolitische und strategische Betrachtung. Universität Potsdam, Dissertation
Witschel HF (2004) Text, Wörter, Morpheme – Möglichkeiten einer automatischen Terminologie-Extraktion. Vortrag, Universität Leipzig, Institut für Informatik, Leipzig. Verfügbar unter: http://wortschatz.uni-leipzig.de/∼fwitschel/papers/GLDVPreis.pdf (25.9.2009)
Witte R, Mülle J, Hrsg (2006) Text Mining: Wissensgewinnung aus natürlichsprachigen Dokumenten. Interner Bericht Universität Karlsruhe (TH), Karlsruhe
Author information
Authors and Affiliations
Corresponding author
Rights and permissions
Copyright information
© 2010 Springer-Verlag Berlin Heidelberg
About this chapter
Cite this chapter
Reichenberger, K. (2010). Tagging und assoziative Netze. In: Kompendium semantische Netze. X.media.press. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-642-04315-4_3
Download citation
DOI: https://doi.org/10.1007/978-3-642-04315-4_3
Published:
Publisher Name: Springer, Berlin, Heidelberg
Print ISBN: 978-3-642-04314-7
Online ISBN: 978-3-642-04315-4
eBook Packages: Computer Science and Engineering (German Language)