Zusammenfassung
Aus den oben dargelegten Grundlagen ergibt sich als der Sinn der Anlage von Korpora, die in ihnen enthaltenen Inventare sprachlicher Einheiten und Beziehungen zwischen diesen Einheiten zu ermitteln und in systematischer Form in Lexika und Grammatiken für verschiedenste Anwendungen zu formulieren.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Preview
Unable to display preview. Download preview PDF.
Literatur
Sven Naumann/Hagen Langer: Parsing. Eine Einführung in die maschinelle Analyse natürlicher Sprache. Stuttgart: B. G. Teubner, 1994.
Terry Winograd: Language as a Cognitive Process I. Syntax. Reading, Mass.: Addison-Wesley, 1983
Als Beginn dieser Sichtweise und damit auch als Ursprung der algorithmischen Verarbeitung auch semantischer Sachverhalte und der dazu gehörigen algorithmisch orientierten Theoriebildung in der Semantik kann der 1968 publizierte Ansatz von Quillian gelten, lexikalische Bedeutungen von Wörtern in Form eines semantischen Netzes (semantic network) darzustellen. Seit 1968 hat es besonders seitens der amerikanischen sprachbezogenen Forschung zur Künstlichen Intelligenz zahlreiche Ansätze zur Darstellung semantischer Netze gegeben, auf die hier nicht eingegangen werden kann (vgl. z. B. Norman/Rumelhart 1975).
M. Ross Quillian: Semantic Memory. In: Marvin Minsky (ed.): Semantic Information Processing. Cambridge, Mass.-London 1968.
Donald A. Norman/David E. Rumelhart (eds.): Explorations in Cognition. San Francisco 1975.
Hans Eggers und Mitarbeiter: Elektronische Syntaxanalyse der deutschen Gegenwartssprache. Tübingen: Niemeyer, 1969.
Winfried Lenders: Fragment einer deskriptiven Grammatik zu Heinrich Wittenwilers “Ring”. In: Helmut Droop/Winfried Lenders/Michael Zeller: Untersuchungen zur grammatischen Klassifizierung und maschinellen Bearbeitung spätmittelhochdeutscherTexte. Hamburg: Buske, 1976.
Winfried Lenders/Klaus Peter Wegera (Hg.): Maschinelle Auswertung sprachhistorischerQuellen. Tübingen: Niemeyer, 1982.
Gisela Zifonun/Ludger Hoffmann/Bruno Strecker: Grammatik der deutschen Sprache. Berlin: Walter de Gruyter and Co, 1997.
Hans PeterAlthaus/Helmut Henne/Herbert Ernst Wiegand: Lexikon der Germanistischen Linguistik. 2. Auflage. Tübingen: Niemeyer, 1980.
Peter Eisenberg: Grundriß der Deutschen Grammatik. 3. Auflage. Stuttgart: Metzlersche Verlagsbuchhandlung, 1994.
Ulrich Engel: Deutsche Grammatik. 2. verb. Auflage. Heidelberg: Julius Gross Verlag, 1991.
Willée, Gerd: LEMMA2 - eine Weiterentwicklung von LEMMA. In: IKP-Forschungsbericht 1 (Ms.). Bonn, 1984.
Sonderforschungsbereich 100 “Elektronische Sprachforschung”: SALEM - Ein Verfahren zur automatischen Lemmatisierung deutscher Texte. Tübingen: Niemeyer, 1980.
Heinz-Josef Weber: Automatische Lemmatisierung. In: Linguistische Berichte 44 (1976), S. 30–42.
Peter Hellwig: Parsing natürlicher Sprachen: Grundlagen. In: Handbuch Computerlinguistik. Berlin: De Gruyter, 1989, S. 348–377.
Peter Hellwig: Parsing natürlicher Sprachen: Realisierungen. In: Handbuch Computerlinguistik. Berlin: De Gruyter, 1989, S. 378–431.
Sven Naumann und Hagen Langer: Parsing. Eine Einführung in die maschinelle Analyse natürlicher Sprache. Stuttgart: Teubner, 1994.
Terry Winograd: Language as a Cognitive Process. Vol. I: Syntax. Reading, Mass., 1983.
R.G. Garside/G.N. Leech/G.R. Sampson (eds.): The Computational Analysis of English. Longman, 1987.
Stig Johansson et al.: The Tagged LOB Corpus. Norwegian Computing Centre for the Humanities. Bergen, 1986.
Geoffrey Leech/Roger Garside: Running A Grammar Factory: The Production of Syntactically Analysed Corpora or “Treebanks”. In: Johansson/Stenström, (1991) S. 15–32.
Steven J. DeRose: An Analysis of Probabilistic Grammatical Tagging Methods. In: Johansson/Stenström 1991, S. 9–14.
Steven J. DeRose: Grammatical Category Disambiguation by Statistical Optimization. In: Computational Linguistics 14 (1988), S. 31–39.
Ian Lancashire (ed.): The Humanities Computing Yearbook 1989–90. A Comprehensive Guide to Software and Other Resources. Oxford: Clarendon Press, 1991.
Winfried Lenders: Tagging–Formen und Tools. In: Sprachtechnologie: Methoden, Werkzeuge, Perspektiven. Hg.v. Horst P. Pütz und Johann Haller. Hildesheim: Olms, 1993, S. 369–401.
Hans Eggers und Mitarbeiter: Elektronische Syntaxanalyse der deutschen Gegenwartssprache. Tübingen: Niemeyer, 1969.
Mitchell R. Marcus: ATheory of Syntactic Recognition for Natural Language. Cambridge, Mass.: MIT Press, 1980.
Mitchell P. Marcus/Beatrice Santorini/Mary Ann Marcinkeiwicz: Building a Large Annotated Corpus of English: The Penn Treebank. In: Computational Linguistics 19 (1993), S. 313–330.
Donald Hindle: Fidditch User Manual. Naval Research Laboratory Technical Memorandum No. 7590–142, 1983.
Kenneth Church: A Stochastic Parts Program and Noun Phrase Parser for Unrestricted Text. In: Proceedings of the Second ACL Conference on Applied Natural Language Processing. 1988.
R.A. Sharman: Hidden Markov Model Methods for Word Tagging. Winchester (= IBM UK Scientific Center Report 214 ). 1989.
Klaus Wothke: Statistisch basiertes Wortklassentagging von deutschen Textkorpora. Einige Experimente. In: Sprachtechnologie: Methoden, Werkzeuge, Perspektiven. Hg.v. Horst P. Pütz und Johann Haller. Hildesheim: Olms, 1993, S. 315–319.
Tokens: die in einem Text vorkommenden laufenden Wortformen. Tokens dienen als Maß für die Länge eines Textes (der Text X hat eine Länge von yyy Wortformen).
Gabriel Altmann/Werner Lehfeldt: Allgemeine Sprachtypologie. Prinzipien und Meßverfahren. München: Fink, 1973.
G. Altmann: Statistik für Linguisten. Bochum 1980. 2. verb. Aufl. Trier: Wiss. Verlag Trier, 1995.
Wilhelm Fucks: Nach allen Regeln der Kunst. Stuttgart: Deutsche Verlags-Anstalt, 1968.
Friedrich Wilhelm Kaeding: Häufigkeitswörterbuch der deutschen Sprache. 1–2. Berlin, 1897/98.
Reinhard Köhler/Gabriel Altmann: Status und Funktion quantitativer Verfahren in der Computerlinguistik. In: Handbuch Computerlinguistik, hg. von I. Baton, W. Lenders und W. Putschke. Berlin: de Gruyter, 1989. S. 113–119.
Winfried Lenders: Computergestützte Verfahren zur semantischen Beschreibung von Sprache. In: Handbuch Computerlinguistik. 1989, S. 231–244.
Ursula Pieper: Über die Aussagekraft statistischer Methoden für die linguistische Stilanalyse. Tübingen: Narr, 1979.
Frank Smadja: Retrieving Collocations from Text: Xtract. In: Computational Linguistics 19 (1993), 143–177.
George W. Smith: Computers and Human Language. New York/Oxford: Oxford University Press, 1991.
George Kingsley Zipf: Human Behavior and The Principle of Least Effort. Cambridge, Mass.: Addison-Wesley, 1949.
Author information
Authors and Affiliations
Rights and permissions
Copyright information
© 1998 Springer Fachmedien Wiesbaden
About this chapter
Cite this chapter
Lenders, W., Willée, G. (1998). Auswertung von Korpora. In: Linguistische Datenverarbeitung. VS Verlag für Sozialwissenschaften, Wiesbaden. https://doi.org/10.1007/978-3-663-07979-8_4
Download citation
DOI: https://doi.org/10.1007/978-3-663-07979-8_4
Publisher Name: VS Verlag für Sozialwissenschaften, Wiesbaden
Print ISBN: 978-3-531-13188-7
Online ISBN: 978-3-663-07979-8
eBook Packages: Springer Book Archive