Tagging und assoziative Netze

Reichenberger, Klaus

doi:10.1007/978-3-642-04315-4_3

Klaus Reichenberger²

Part of the book series: X.media.press ((XMEDIAP))

2836 Accesses

Zusammenfassung

Lassen Sie uns in die Übersicht über die verschiedenen Grade der semantischen Informationserschließung mit einer Vorstufe semantischer Netze einsteigen, dem Tagging von Informationen. Tags sind Schlagworte , mit denen beliebige Objekte charakterisiert werden können. Tags sind nichts grundsätzlich Neues, wir kennen sie als Teil einer klassischen Kombination aus jeder Bibliothek.¹ Hier sind die Bücher nach einer Aufstellungssystematik in Regale (= in Ordner) eingeordnet, daneben aber auch in einem Schlagwortkatalog verzeichnet (= mit Tags versehen). Diese Schlagworte werden entweder vom Verlag vorgeschlagen oder von einem Mitarbeiter der Bibliothek vergeben, der das Buch gelesen oder mindesten überflogen hat; als Dienstleistung für die Nutzer der Bibliothek.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Log in via an institution

Chapter: USD 29.95; Price excludes VAT (USA)

eBook: USD 49.99; Price excludes VAT (USA)

Hardcover Book: USD 49.99; Price excludes VAT (USA)

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Notes

1.
Es ist im Übrigen bemerkenswert, wie selten Techniken, die sich seit Jahrzehnten in der Dokumentation und Bibliothekswesen bewährt haben, im Bereich Knowledge-Management Beachtung finden. Eine mögliche Erklärung könnte in der schwachen Position der Bibliothekswissenschaften als Wissenschaftsdisziplin liegen (siehe auch Simon 2004).
2.
http://www.flickr.com
3.
Der Vergleich wird in der Praxis nicht mit allen Wörtern aller Dokumente durchgeführt – welche Auswahl in den Vergleich mit einbezogen wird, ist das Geschäftsgeheimnis der verschiedenen Clustering-Verfahren am Markt.
4.
Siehe z.B. Mao (2006).
5.
Das Beispiel wurde im April 2009 mit der clustering engine clusty (http://www.clusty.com) durch die Eingabe des Suchbegriffs „espresso machine“ generiert. Wie oben erwähnt, gibt es viele Cluster-Verfahren; andere Verfahren werden für dieses Beispiel andere Ergebnisse liefern. Mit diesem Beispiel und im Rahmen dieses Kompendiums können wir unmöglich allen Verfahren gerecht werden. Wir haben uns bei den Schwierigkeiten und Grenzen automatischer Verfahren, die wir im Folgenden aufführen, auf die Punkte konzentriert, die grundsätzlicher Natur sind und bei allen Verfahren auftreten werden, die semantische Netze rein aus Dokumentbeständen heraus aufbauen.
6.
Es ist leicht vorstellbar, wie es dazu kommt: Nur in Texten, in denen es um beide Gerätetypen geht, besteht auch ein großer Bedarf nach sprachlicher Abgrenzung, also werden sie auch nur in diesen Texten häufig explizit genannt werden: „in diesem Absatz geht es um home espresso machines, jenes Feature gibt es nur bei commercial machines usw“. D.h. gerade Begriffe, die Gegensätze oder verschiedene Fälle voneinander abgrenzen, kommen oft zusammen vor und werden in der Clusteranalyse zusammengeworfen.
7.
Eine der etabliertesten Strategien der Extraktion von Objekten und Fakten aus unstrukturierten Texten. Siehe (Rostek 1979).
8.
An eine Oberbegriffsrelation haben wir strenge Anforderungen (siehe Abschn. 5.1), die wir bei assoziativen Netzen nicht anlegen können.

Literatur

Barbosa D. (2008) Taxonomy Folksonomy Cookbook. Dow Jones, New York. Verfügbar unter: http://solutions.dowjones.com/cookbook/ebook_sla2008/cookbookebook.pdf (25.9.2009)
Faatz A (2004) Ein Verfahren zur Anreicherung fachgebietsspezifischer Ontologien durch Begriffsvorschläge. Dissertation, TU-Darmstadt. Verfügbar unter: http://elib.tu-darmstadt.de/diss/000505/diss_deutsch.pdf (2.5.2009)
Faatz A, Steinmetz A (2004) Ontology Enrichment Evaluation. In: Motta E, Shadbolt N, Stutt A, Gibbins N (Hrsg) Engineering Knowledge in the Age of the SemanticWeb. Springer, Heidelberg
Google Scholar
Manning CD, Schütze H (1999) Foundations of Statistical Natural Language Processing. MIT Press, Cambridge
MATH Google Scholar
Mao J (2006) US Patent 7031909 – Method and System for Naming a Cluster of Words and Phrases
Google Scholar
Rostek L (1979) Methoden des partiellen Parsings für das automatische Indexing – Syntaxgraphen zur Analyse von Sprachmustern. In: Kuhlen R (Hrsg) Datenbasen – Datenbanken – Netzwerke. Praxis des Information Retrieval. Saur, München
Google Scholar
Simon T (2004) Die Positionierung einer Universitäts- und Hochschulbibliothek in der Wissensgesellschaft: eine bibliothekspolitische und strategische Betrachtung. Universität Potsdam, Dissertation
Google Scholar
Witschel HF (2004) Text, Wörter, Morpheme – Möglichkeiten einer automatischen Terminologie-Extraktion. Vortrag, Universität Leipzig, Institut für Informatik, Leipzig. Verfügbar unter: http://wortschatz.uni-leipzig.de/∼fwitschel/papers/GLDVPreis.pdf (25.9.2009)
Witte R, Mülle J, Hrsg (2006) Text Mining: Wissensgewinnung aus natürlichsprachigen Dokumenten. Interner Bericht Universität Karlsruhe (TH), Karlsruhe
Google Scholar

Download references

Author information

Authors and Affiliations

Julius-Reiber-Str. 17, 64293, Darmstadt, Germany
Klaus Reichenberger

Authors

Klaus Reichenberger
View author publications
You can also search for this author in PubMed Google Scholar

Corresponding author

Correspondence to Klaus Reichenberger .

Rights and permissions

Reprints and permissions

Copyright information

About this chapter

Cite this chapter

Reichenberger, K. (2010). Tagging und assoziative Netze. In: Kompendium semantische Netze. X.media.press. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-642-04315-4_3

Download citation

DOI: https://doi.org/10.1007/978-3-642-04315-4_3
Published: 24 February 2010
Publisher Name: Springer, Berlin, Heidelberg
Print ISBN: 978-3-642-04314-7
Online ISBN: 978-3-642-04315-4
eBook Packages: Computer Science and Engineering (German Language)

Publish with us

Policies and ethics