Strukturelle Beschreibung der Wissensquellen des Text-Parsers

Hahn, Udo

doi:10.1007/978-3-642-76132-4_3

Strukturelle Beschreibung der Wissensquellen des Text-Parsers

Udo Hahn²

Chapter

23 Accesses

Part of the book series: Informatik-Fachberichte ((INFORMATIK,volume 243))

Zusammenfassung

Der hier beschriebene Text-Parser verfügt über drei²¹³ Typen von Wissensquellen:

(1)
Wissen über die konzeptuelle Struktur des Weltausschnitts, auf den sich die zu analysierenden Texte beziehen. Dieses Wissen wird in Kap. 3.1 exemplarisch im Rahmen eines Frame-Repräsentationsmodells beschrieben, durch das die semantischen Primitive des Wortexpertensystems festgelegt sind.
(2)
Wissen über den operationellen Ablauf des Parsing-Prozesses. Entsprechende Informationen enthält das Parser-Bulletin, in dem die im Verlauf der Textanalyse betrachteten lexikalischen Einheiten und die zwischen ihnen identifizierten semantischen und syntaktischen Bezüge protokolliert sind. Dieses Wissen wird in Form einer tabellenartigen Struktur repräsentiert und zusammen mit den dazugehörigen Kommunikationsprimitiven in Kap. 3.3 beschrieben.
(3)
Prüfungen der konzeptuellen und operationellen Konstellationen, in die ein lexikalisches Element im Text eingebunden ist, machen den Spezifikationskern jedes Wortexperten aus. Daraus folgende (Zwischen-)Ergebnisse werden als interne Zustände einzelner Wortexperten in Form von Variablenbelegungen, Statusmeldungen, Anlaufbedingungen usf. akkumuliert und in geeigneter Weise in den Botschaftsaustausch zwischen einzelnen Wortexperten einbezogen. Deren Struktur wird in Kap. 3.2 eingehender betrachtet.

This is a preview of subscription content, log in via an institution.

Chapter: USD 29.95; Price excludes VAT (USA)

eBook: USD 54.99; Price excludes VAT (USA)

Softcover Book: USD 69.99; Price excludes VAT (USA)

Tax calculation will be finalised at checkout

Purchases are for personal use only

Learn about institutional subscriptions

Preview

Unable to display preview. Download preview PDF.

Literature

Liskov/Zilles 1974.
Google Scholar
Vollständige(re) Beschreibungen von FRM enthalten REIMER/HAHN 1985 und Reimer 1989.
Google Scholar
Die damit realisierte Abstraktion für die Interaktionen des Wortexperten-Parsers mit der Systemkomponente, die das Weltwissen enthält (die sog. Weltwissensbasis), zählte bislang zu den hervorstechendsten methodischen Desiderata des Standardmodells (vgl. Small 1980, S.192–193; Adriaens 1986b, S.222–223).
Google Scholar
Spezialisierungsrelationen und Attribution finden sich in ähnlicher Weise auch in der sortenlogischen Repräsentationssprache (M)SRL (HABEL/REDDIG/ROLLINGER 1981) wieder, die die semantische Zielsprache der in Eimermacher 1983a beschriebenen Wortexpertenentwicklung ist und die somit ebenfalls auf ein von der jeweiligen Wortexperten-Spezifikation unabhängiges Wissensrepräsentationssystem rekurriert.
Google Scholar
Die Behandlung von Defaults befindet sich erst in einem explorativen Modellstadium; s. Reimer 1989, Kap.5.
Google Scholar
Ebd., S.30–35. Referentielles Wissen hat in der hier betrachteten Textklasse im übrigen einen wesentlich geringeren Stellenwert als etwa in Frage-Antwort-System-Kontexten, da Produktbeschreibungen oder Testberichte stets den jeweiligen Prototypen zum Gegenstand haben und (wenn überhaupt) nur am Rande auf Auffälligkeiten des speziellen Testexemplars eingehen.
Google Scholar
In diesem und in den Anschlußkapiteln 3.2 und 3.3 wird ergänzend zu den formalen Charakterisierungen der Wissensquellen durch Funktionen und Mengen eine diesen Beschreibungen entsprechende Darstellung im Kalkül der conceptual representations (CR) (vgl. Kap. 2.3 dieser Arbeit bzw. Yonezawa 1977, S.17–37) gegeben. Die Beschreibungen durch Funktionen und Mengen sind die Grundlage der Spezifikation des Vokabulars der Wortexperten in Kap. 3, während in Kap. 4 die Spezifikation der eigentlichen Textgrammatik auf den Beschreibungen der durch conceptual representations gegebenen Datenstrukturen beruht. Der Grund für diese Doppelgleisigkeit liegt in dem Versuch, beide Beschreibungen zu entkoppeln und für sich möglichst lesbar zu halten. Die hier beschriebenen Wissensquellen, aber mehr noch die auf ihnen ausführbaren Operationen sind somit in einem allgemeinverständlichen und weitverbreiteten Kalkül spezifiziert, die textgrammatische Spezifikation gewinnt demgegenüber durch die Verwendung von conceptual representations ihrerseits stark an Lesbarkeit. Die konsistente Transformation von Ausdrücken aus dem FOL- oder Funktionenkalkül in äquivalente CR-Ausdrücke wird hier nicht gezeigt. Aber mit den semantischen Restriktionen der zulässigen Werte für alle Komponenten einer solchen Darstellung (s.u.) ist die Anbindung an die Jeweils äquivalente FOL- oder Funktionendarstellung in hinreichender Weise festgelegt.
Google Scholar
Die Ebene von individuellen Referenzobjekten wird hier nicht betrachtet; s. Reimer 1989, S.30–35.
Google Scholar
Eine formale semantische Spezifikation geben REIMER/HAHN 1985, S.338 bzw. Reimer 19–89, S.41 und S.49/50.
Google Scholar
Eine formale semantische Spezifikation geben REIMER/HAHN 1985, S.340 bzw. Reimer 1989. S.56/58.
Google Scholar
Vgl. zur Illustration Appendix-3, die Bulletin-Positionen 009 und 157.
Google Scholar
S. Reimer 1989, Kap. 4.2, S.99 zu einer semantischen Spezifikation.
Google Scholar
S. Reimer 1989, Kap.4.2, S. 102–105, 106–107 zu einer semantischen Spezifikation.
Google Scholar
S. Reimer 1989, Kap.4.2, S. 102–105 zu einer semantischen Spezifikation dieser Operation.
Google Scholar
Dies entspricht den Rahmenbedingungen des TOPIC-Systems; vgl. HAHN/REIMER 1986 und Hahn 1990.
Google Scholar
norm ist eine Funktion, die aus einem flektierten Texttoken die morphologische Normalform (Grundform) erzeugt. In der hier beschriebenen Version des Text-Parsers wird lediglich die Nominalflexion normalisiert (Verben und entsprechende Konjugationsformen werden nicht betrachtet) und entsprechende Grundformen erzeugt. Die in norm abgespaltenen Flexive werden nicht weiter betrachtet. Dies kann sich grundlegend ändern, wenn etwa weitergehende syntaktische Tests (etwa auf Kongruenz) durchgeführt werden müssen, d.h. Flexionsendungen parsing-relevant werden (bereits in den Formulierungen des Wortexperten-Standardmodells sind solche Flexiv-Experten spezifiziert worden; vgl. Small 1980, S.193–196 und Appendix B).
Google Scholar
Trotz nahezu gleichlautender Namen hat das hier beschriebene “Parser-Bulletin”, dessen Grundfunktion die Protokollierung der Parser-Historie ist, kaum Ähnlichkeit mit dem bulletin board des Standardmodells des Wortexperten-Parsing (vgl. Rieger/Small 1979, S.725). Dort dient es eindeutig als globales Medium für vielfältige Steuerungsinformationen des Wortexperten-Parsers und enthält Zustandsbeschreibungen jedes einzelnen Wortexperten, des gesamten Parsers und Details der inkrementell aufgebauten Wissensrepräsentationsstrukturen — es besitzt in dieser Hinsicht viel Ähnlichkeit mit dem aus dem Hearsay-System bekannten blackboard-Konzept (vgl. Erman et al. 1980). Ein solch globales Steuerungsinstrument widerspricht nicht nur Prinzipien der Aktorenspezifikation, sondern ist spezifikationstechnisch auch unnötig, da Wortexperten nur gezielt miteinander kommunizieren (vgl. die Ausführungen zum Aktorenmodell als lokales Berechnungsmodell, Kap. 2.3). Wesentlich ausgeprägter ist dagegen die konzeptionelle Nähe des “Parser-Bulletins” zur blackboard (verschieden vom gleichnamigen Konzept in Hearsay!), wie sie in einer theoretischen Vorphase der Wortexper-ten-Modellierung in Small 1978, S.16 beschrieben ist und insbesondere der auch für die hier entwickelte Modellvariante wichtige Effekt der Bedeutungs- und Inferenzkonditionierung für nachfolgende Prozesse durch die Protokollierung der Parser-Historie eine wesentliche Rolle spielt.
Google Scholar
Eine genau korrespondierende Beschreibung würde die Einführung zusätzlicher Konstrukte aus dem Kalkül der conceptual representations verlangen (vgl. Yonezawa 1977, S. 17–35), ohne daß daraus ein spürbarer Darstellungsgewinn für die hier zu beschreibenden Phänomene resultieren würde.
Google Scholar
Beim momentanen Stand der Modellierung des Wortexperten-Parsers wird auf jede Form phrasenstruktureller Analysen verzichtet. Dies soll keine prinzipielle Einschränkung sein, reflektiert jedoch die Arbeitshypothese, daß linguistisch relevante Ko-Okkurrenzbeziehungen primär semantisch motiviert sind (vgl.a. Rieger 1978, S.97–98).
Google Scholar
Eine Variante dieser Spezifikation, die das abgeleitete Thema mehrerer Absätze berechnet, gibt Hahn 1990.
Google Scholar

Download references

Author information

Authors and Affiliations

Fakultät für Mathematik und Informatik, Universität Passau, Postfach 2540, W-8390, Passau, Deutschland
Udo Hahn

Authors

Udo Hahn
View author publications
You can also search for this author in PubMed Google Scholar

Rights and permissions

Reprints and permissions

Copyright information

About this chapter

Cite this chapter

Hahn, U. (1990). Strukturelle Beschreibung der Wissensquellen des Text-Parsers. In: Lexikalisch verteiltes Text-Parsing. Informatik-Fachberichte, vol 243. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-642-76132-4_3

Download citation

DOI: https://doi.org/10.1007/978-3-642-76132-4_3
Publisher Name: Springer, Berlin, Heidelberg
Print ISBN: 978-3-540-53230-9
Online ISBN: 978-3-642-76132-4
eBook Packages: Springer Book Archive

Publish with us

Policies and ethics