Auswertung von Korpora

Lenders, Wilfried; Willée, Gerd

doi:10.1007/978-3-663-07979-8_4

Wilfried Lenders² &
Gerd Willée²

68 Accesses

Zusammenfassung

Aus den oben dargelegten Grundlagen ergibt sich als der Sinn der Anlage von Korpora, die in ihnen enthaltenen Inventare sprachlicher Einheiten und Beziehungen zwischen diesen Einheiten zu ermitteln und in systematischer Form in Lexika und Grammatiken für verschiedenste Anwendungen zu formulieren.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Log in via an institution

Chapter: USD 29.95; Price excludes VAT (USA)

eBook: USD 54.99; Price excludes VAT (USA)

Softcover Book: USD 69.99; Price excludes VAT (USA)

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Preview

Unable to display preview. Download preview PDF.

Literatur

Sven Naumann/Hagen Langer: Parsing. Eine Einführung in die maschinelle Analyse natürlicher Sprache. Stuttgart: B. G. Teubner, 1994.
Google Scholar
Terry Winograd: Language as a Cognitive Process I. Syntax. Reading, Mass.: Addison-Wesley, 1983
Google Scholar
Als Beginn dieser Sichtweise und damit auch als Ursprung der algorithmischen Verarbeitung auch semantischer Sachverhalte und der dazu gehörigen algorithmisch orientierten Theoriebildung in der Semantik kann der 1968 publizierte Ansatz von Quillian gelten, lexikalische Bedeutungen von Wörtern in Form eines semantischen Netzes (semantic network) darzustellen. Seit 1968 hat es besonders seitens der amerikanischen sprachbezogenen Forschung zur Künstlichen Intelligenz zahlreiche Ansätze zur Darstellung semantischer Netze gegeben, auf die hier nicht eingegangen werden kann (vgl. z. B. Norman/Rumelhart 1975).
Google Scholar
M. Ross Quillian: Semantic Memory. In: Marvin Minsky (ed.): Semantic Information Processing. Cambridge, Mass.-London 1968.
Google Scholar
Donald A. Norman/David E. Rumelhart (eds.): Explorations in Cognition. San Francisco 1975.
Google Scholar
Hans Eggers und Mitarbeiter: Elektronische Syntaxanalyse der deutschen Gegenwartssprache. Tübingen: Niemeyer, 1969.
Google Scholar
Winfried Lenders: Fragment einer deskriptiven Grammatik zu Heinrich Wittenwilers “Ring”. In: Helmut Droop/Winfried Lenders/Michael Zeller: Untersuchungen zur grammatischen Klassifizierung und maschinellen Bearbeitung spätmittelhochdeutscherTexte. Hamburg: Buske, 1976.
Google Scholar
Winfried Lenders/Klaus Peter Wegera (Hg.): Maschinelle Auswertung sprachhistorischerQuellen. Tübingen: Niemeyer, 1982.
Google Scholar
Gisela Zifonun/Ludger Hoffmann/Bruno Strecker: Grammatik der deutschen Sprache. Berlin: Walter de Gruyter and Co, 1997.
Google Scholar
Hans PeterAlthaus/Helmut Henne/Herbert Ernst Wiegand: Lexikon der Germanistischen Linguistik. 2. Auflage. Tübingen: Niemeyer, 1980.
Google Scholar
Peter Eisenberg: Grundriß der Deutschen Grammatik. 3. Auflage. Stuttgart: Metzlersche Verlagsbuchhandlung, 1994.
Google Scholar
Ulrich Engel: Deutsche Grammatik. 2. verb. Auflage. Heidelberg: Julius Gross Verlag, 1991.
Google Scholar
Willée, Gerd: LEMMA2 - eine Weiterentwicklung von LEMMA. In: IKP-Forschungsbericht 1 (Ms.). Bonn, 1984.
Google Scholar
Sonderforschungsbereich 100 “Elektronische Sprachforschung”: SALEM - Ein Verfahren zur automatischen Lemmatisierung deutscher Texte. Tübingen: Niemeyer, 1980.
Google Scholar
Heinz-Josef Weber: Automatische Lemmatisierung. In: Linguistische Berichte 44 (1976), S. 30–42.
Google Scholar
Peter Hellwig: Parsing natürlicher Sprachen: Grundlagen. In: Handbuch Computerlinguistik. Berlin: De Gruyter, 1989, S. 348–377.
Google Scholar
Peter Hellwig: Parsing natürlicher Sprachen: Realisierungen. In: Handbuch Computerlinguistik. Berlin: De Gruyter, 1989, S. 378–431.
Google Scholar
Sven Naumann und Hagen Langer: Parsing. Eine Einführung in die maschinelle Analyse natürlicher Sprache. Stuttgart: Teubner, 1994.
Google Scholar
Terry Winograd: Language as a Cognitive Process. Vol. I: Syntax. Reading, Mass., 1983.
Google Scholar
R.G. Garside/G.N. Leech/G.R. Sampson (eds.): The Computational Analysis of English. Longman, 1987.
Google Scholar
Stig Johansson et al.: The Tagged LOB Corpus. Norwegian Computing Centre for the Humanities. Bergen, 1986.
Google Scholar
Geoffrey Leech/Roger Garside: Running A Grammar Factory: The Production of Syntactically Analysed Corpora or “Treebanks”. In: Johansson/Stenström, (1991) S. 15–32.
Google Scholar
Steven J. DeRose: An Analysis of Probabilistic Grammatical Tagging Methods. In: Johansson/Stenström 1991, S. 9–14.
Google Scholar
Steven J. DeRose: Grammatical Category Disambiguation by Statistical Optimization. In: Computational Linguistics 14 (1988), S. 31–39.
Google Scholar
Ian Lancashire (ed.): The Humanities Computing Yearbook 1989–90. A Comprehensive Guide to Software and Other Resources. Oxford: Clarendon Press, 1991.
Google Scholar
Winfried Lenders: Tagging–Formen und Tools. In: Sprachtechnologie: Methoden, Werkzeuge, Perspektiven. Hg.v. Horst P. Pütz und Johann Haller. Hildesheim: Olms, 1993, S. 369–401.
Google Scholar
Hans Eggers und Mitarbeiter: Elektronische Syntaxanalyse der deutschen Gegenwartssprache. Tübingen: Niemeyer, 1969.
Google Scholar
Mitchell R. Marcus: ATheory of Syntactic Recognition for Natural Language. Cambridge, Mass.: MIT Press, 1980.
Google Scholar
Mitchell P. Marcus/Beatrice Santorini/Mary Ann Marcinkeiwicz: Building a Large Annotated Corpus of English: The Penn Treebank. In: Computational Linguistics 19 (1993), S. 313–330.
Google Scholar
Donald Hindle: Fidditch User Manual. Naval Research Laboratory Technical Memorandum No. 7590–142, 1983.
Google Scholar
Kenneth Church: A Stochastic Parts Program and Noun Phrase Parser for Unrestricted Text. In: Proceedings of the Second ACL Conference on Applied Natural Language Processing. 1988.
Google Scholar
R.A. Sharman: Hidden Markov Model Methods for Word Tagging. Winchester (= IBM UK Scientific Center Report 214 ). 1989.
Google Scholar
Klaus Wothke: Statistisch basiertes Wortklassentagging von deutschen Textkorpora. Einige Experimente. In: Sprachtechnologie: Methoden, Werkzeuge, Perspektiven. Hg.v. Horst P. Pütz und Johann Haller. Hildesheim: Olms, 1993, S. 315–319.
Google Scholar
Tokens: die in einem Text vorkommenden laufenden Wortformen. Tokens dienen als Maß für die Länge eines Textes (der Text X hat eine Länge von yyy Wortformen).
Google Scholar
Gabriel Altmann/Werner Lehfeldt: Allgemeine Sprachtypologie. Prinzipien und Meßverfahren. München: Fink, 1973.
Google Scholar
G. Altmann: Statistik für Linguisten. Bochum 1980. 2. verb. Aufl. Trier: Wiss. Verlag Trier, 1995.
Google Scholar
Wilhelm Fucks: Nach allen Regeln der Kunst. Stuttgart: Deutsche Verlags-Anstalt, 1968.
Google Scholar
Friedrich Wilhelm Kaeding: Häufigkeitswörterbuch der deutschen Sprache. 1–2. Berlin, 1897/98.
Google Scholar
Reinhard Köhler/Gabriel Altmann: Status und Funktion quantitativer Verfahren in der Computerlinguistik. In: Handbuch Computerlinguistik, hg. von I. Baton, W. Lenders und W. Putschke. Berlin: de Gruyter, 1989. S. 113–119.
Google Scholar
Winfried Lenders: Computergestützte Verfahren zur semantischen Beschreibung von Sprache. In: Handbuch Computerlinguistik. 1989, S. 231–244.
Google Scholar
Ursula Pieper: Über die Aussagekraft statistischer Methoden für die linguistische Stilanalyse. Tübingen: Narr, 1979.
Google Scholar
Frank Smadja: Retrieving Collocations from Text: Xtract. In: Computational Linguistics 19 (1993), 143–177.
Google Scholar
George W. Smith: Computers and Human Language. New York/Oxford: Oxford University Press, 1991.
Google Scholar
George Kingsley Zipf: Human Behavior and The Principle of Least Effort. Cambridge, Mass.: Addison-Wesley, 1949.
Google Scholar

Download references

Author information

Authors and Affiliations

Bonn, Deutschland
Wilfried Lenders & Gerd Willée

Authors

Wilfried Lenders
View author publications
You can also search for this author in PubMed Google Scholar
Gerd Willée
View author publications
You can also search for this author in PubMed Google Scholar

Rights and permissions

Reprints and permissions

Copyright information

About this chapter

Cite this chapter

Lenders, W., Willée, G. (1998). Auswertung von Korpora. In: Linguistische Datenverarbeitung. VS Verlag für Sozialwissenschaften, Wiesbaden. https://doi.org/10.1007/978-3-663-07979-8_4

Download citation

DOI: https://doi.org/10.1007/978-3-663-07979-8_4
Publisher Name: VS Verlag für Sozialwissenschaften, Wiesbaden
Print ISBN: 978-3-531-13188-7
Online ISBN: 978-3-663-07979-8
eBook Packages: Springer Book Archive

Publish with us

Policies and ethics