Skip to main content

Zusammenfassung

Aus den oben dargelegten Grundlagen ergibt sich als der Sinn der Anlage von Korpora, die in ihnen enthaltenen Inventare sprachlicher Einheiten und Beziehungen zwischen diesen Einheiten zu ermitteln und in systematischer Form in Lexika und Grammatiken für verschiedenste Anwendungen zu formulieren.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Chapter
USD 29.95
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
eBook
USD 54.99
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
Softcover Book
USD 69.99
Price excludes VAT (USA)
  • Compact, lightweight edition
  • Dispatched in 3 to 5 business days
  • Free shipping worldwide - see info

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

Literatur

  • Sven Naumann/Hagen Langer: Parsing. Eine Einführung in die maschinelle Analyse natürlicher Sprache. Stuttgart: B. G. Teubner, 1994.

    Google Scholar 

  • Terry Winograd: Language as a Cognitive Process I. Syntax. Reading, Mass.: Addison-Wesley, 1983

    Google Scholar 

  • Als Beginn dieser Sichtweise und damit auch als Ursprung der algorithmischen Verarbeitung auch semantischer Sachverhalte und der dazu gehörigen algorithmisch orientierten Theoriebildung in der Semantik kann der 1968 publizierte Ansatz von Quillian gelten, lexikalische Bedeutungen von Wörtern in Form eines semantischen Netzes (semantic network) darzustellen. Seit 1968 hat es besonders seitens der amerikanischen sprachbezogenen Forschung zur Künstlichen Intelligenz zahlreiche Ansätze zur Darstellung semantischer Netze gegeben, auf die hier nicht eingegangen werden kann (vgl. z. B. Norman/Rumelhart 1975).

    Google Scholar 

  • M. Ross Quillian: Semantic Memory. In: Marvin Minsky (ed.): Semantic Information Processing. Cambridge, Mass.-London 1968.

    Google Scholar 

  • Donald A. Norman/David E. Rumelhart (eds.): Explorations in Cognition. San Francisco 1975.

    Google Scholar 

  • Hans Eggers und Mitarbeiter: Elektronische Syntaxanalyse der deutschen Gegenwartssprache. Tübingen: Niemeyer, 1969.

    Google Scholar 

  • Winfried Lenders: Fragment einer deskriptiven Grammatik zu Heinrich Wittenwilers “Ring”. In: Helmut Droop/Winfried Lenders/Michael Zeller: Untersuchungen zur grammatischen Klassifizierung und maschinellen Bearbeitung spätmittelhochdeutscherTexte. Hamburg: Buske, 1976.

    Google Scholar 

  • Winfried Lenders/Klaus Peter Wegera (Hg.): Maschinelle Auswertung sprachhistorischerQuellen. Tübingen: Niemeyer, 1982.

    Google Scholar 

  • Gisela Zifonun/Ludger Hoffmann/Bruno Strecker: Grammatik der deutschen Sprache. Berlin: Walter de Gruyter and Co, 1997.

    Google Scholar 

  • Hans PeterAlthaus/Helmut Henne/Herbert Ernst Wiegand: Lexikon der Germanistischen Linguistik. 2. Auflage. Tübingen: Niemeyer, 1980.

    Google Scholar 

  • Peter Eisenberg: Grundriß der Deutschen Grammatik. 3. Auflage. Stuttgart: Metzlersche Verlagsbuchhandlung, 1994.

    Google Scholar 

  • Ulrich Engel: Deutsche Grammatik. 2. verb. Auflage. Heidelberg: Julius Gross Verlag, 1991.

    Google Scholar 

  • Willée, Gerd: LEMMA2 - eine Weiterentwicklung von LEMMA. In: IKP-Forschungsbericht 1 (Ms.). Bonn, 1984.

    Google Scholar 

  • Sonderforschungsbereich 100 “Elektronische Sprachforschung”: SALEM - Ein Verfahren zur automatischen Lemmatisierung deutscher Texte. Tübingen: Niemeyer, 1980.

    Google Scholar 

  • Heinz-Josef Weber: Automatische Lemmatisierung. In: Linguistische Berichte 44 (1976), S. 30–42.

    Google Scholar 

  • Peter Hellwig: Parsing natürlicher Sprachen: Grundlagen. In: Handbuch Computerlinguistik. Berlin: De Gruyter, 1989, S. 348–377.

    Google Scholar 

  • Peter Hellwig: Parsing natürlicher Sprachen: Realisierungen. In: Handbuch Computerlinguistik. Berlin: De Gruyter, 1989, S. 378–431.

    Google Scholar 

  • Sven Naumann und Hagen Langer: Parsing. Eine Einführung in die maschinelle Analyse natürlicher Sprache. Stuttgart: Teubner, 1994.

    Google Scholar 

  • Terry Winograd: Language as a Cognitive Process. Vol. I: Syntax. Reading, Mass., 1983.

    Google Scholar 

  • R.G. Garside/G.N. Leech/G.R. Sampson (eds.): The Computational Analysis of English. Longman, 1987.

    Google Scholar 

  • Stig Johansson et al.: The Tagged LOB Corpus. Norwegian Computing Centre for the Humanities. Bergen, 1986.

    Google Scholar 

  • Geoffrey Leech/Roger Garside: Running A Grammar Factory: The Production of Syntactically Analysed Corpora or “Treebanks”. In: Johansson/Stenström, (1991) S. 15–32.

    Google Scholar 

  • Steven J. DeRose: An Analysis of Probabilistic Grammatical Tagging Methods. In: Johansson/Stenström 1991, S. 9–14.

    Google Scholar 

  • Steven J. DeRose: Grammatical Category Disambiguation by Statistical Optimization. In: Computational Linguistics 14 (1988), S. 31–39.

    Google Scholar 

  • Ian Lancashire (ed.): The Humanities Computing Yearbook 1989–90. A Comprehensive Guide to Software and Other Resources. Oxford: Clarendon Press, 1991.

    Google Scholar 

  • Winfried Lenders: Tagging–Formen und Tools. In: Sprachtechnologie: Methoden, Werkzeuge, Perspektiven. Hg.v. Horst P. Pütz und Johann Haller. Hildesheim: Olms, 1993, S. 369–401.

    Google Scholar 

  • Hans Eggers und Mitarbeiter: Elektronische Syntaxanalyse der deutschen Gegenwartssprache. Tübingen: Niemeyer, 1969.

    Google Scholar 

  • Mitchell R. Marcus: ATheory of Syntactic Recognition for Natural Language. Cambridge, Mass.: MIT Press, 1980.

    Google Scholar 

  • Mitchell P. Marcus/Beatrice Santorini/Mary Ann Marcinkeiwicz: Building a Large Annotated Corpus of English: The Penn Treebank. In: Computational Linguistics 19 (1993), S. 313–330.

    Google Scholar 

  • Donald Hindle: Fidditch User Manual. Naval Research Laboratory Technical Memorandum No. 7590–142, 1983.

    Google Scholar 

  • Kenneth Church: A Stochastic Parts Program and Noun Phrase Parser for Unrestricted Text. In: Proceedings of the Second ACL Conference on Applied Natural Language Processing. 1988.

    Google Scholar 

  • R.A. Sharman: Hidden Markov Model Methods for Word Tagging. Winchester (= IBM UK Scientific Center Report 214 ). 1989.

    Google Scholar 

  • Klaus Wothke: Statistisch basiertes Wortklassentagging von deutschen Textkorpora. Einige Experimente. In: Sprachtechnologie: Methoden, Werkzeuge, Perspektiven. Hg.v. Horst P. Pütz und Johann Haller. Hildesheim: Olms, 1993, S. 315–319.

    Google Scholar 

  • Tokens: die in einem Text vorkommenden laufenden Wortformen. Tokens dienen als Maß für die Länge eines Textes (der Text X hat eine Länge von yyy Wortformen).

    Google Scholar 

  • Gabriel Altmann/Werner Lehfeldt: Allgemeine Sprachtypologie. Prinzipien und Meßverfahren. München: Fink, 1973.

    Google Scholar 

  • G. Altmann: Statistik für Linguisten. Bochum 1980. 2. verb. Aufl. Trier: Wiss. Verlag Trier, 1995.

    Google Scholar 

  • Wilhelm Fucks: Nach allen Regeln der Kunst. Stuttgart: Deutsche Verlags-Anstalt, 1968.

    Google Scholar 

  • Friedrich Wilhelm Kaeding: Häufigkeitswörterbuch der deutschen Sprache. 1–2. Berlin, 1897/98.

    Google Scholar 

  • Reinhard Köhler/Gabriel Altmann: Status und Funktion quantitativer Verfahren in der Computerlinguistik. In: Handbuch Computerlinguistik, hg. von I. Baton, W. Lenders und W. Putschke. Berlin: de Gruyter, 1989. S. 113–119.

    Google Scholar 

  • Winfried Lenders: Computergestützte Verfahren zur semantischen Beschreibung von Sprache. In: Handbuch Computerlinguistik. 1989, S. 231–244.

    Google Scholar 

  • Ursula Pieper: Über die Aussagekraft statistischer Methoden für die linguistische Stilanalyse. Tübingen: Narr, 1979.

    Google Scholar 

  • Frank Smadja: Retrieving Collocations from Text: Xtract. In: Computational Linguistics 19 (1993), 143–177.

    Google Scholar 

  • George W. Smith: Computers and Human Language. New York/Oxford: Oxford University Press, 1991.

    Google Scholar 

  • George Kingsley Zipf: Human Behavior and The Principle of Least Effort. Cambridge, Mass.: Addison-Wesley, 1949.

    Google Scholar 

Download references

Author information

Authors and Affiliations

Authors

Rights and permissions

Reprints and permissions

Copyright information

© 1998 Springer Fachmedien Wiesbaden

About this chapter

Cite this chapter

Lenders, W., Willée, G. (1998). Auswertung von Korpora. In: Linguistische Datenverarbeitung. VS Verlag für Sozialwissenschaften, Wiesbaden. https://doi.org/10.1007/978-3-663-07979-8_4

Download citation

  • DOI: https://doi.org/10.1007/978-3-663-07979-8_4

  • Publisher Name: VS Verlag für Sozialwissenschaften, Wiesbaden

  • Print ISBN: 978-3-531-13188-7

  • Online ISBN: 978-3-663-07979-8

  • eBook Packages: Springer Book Archive

Publish with us

Policies and ethics