Zusammenfassung
Der hier beschriebene Text-Parser verfügt über drei213 Typen von Wissensquellen:
-
(1)
Wissen über die konzeptuelle Struktur des Weltausschnitts, auf den sich die zu analysierenden Texte beziehen. Dieses Wissen wird in Kap. 3.1 exemplarisch im Rahmen eines Frame-Repräsentationsmodells beschrieben, durch das die semantischen Primitive des Wortexpertensystems festgelegt sind.
-
(2)
Wissen über den operationellen Ablauf des Parsing-Prozesses. Entsprechende Informationen enthält das Parser-Bulletin, in dem die im Verlauf der Textanalyse betrachteten lexikalischen Einheiten und die zwischen ihnen identifizierten semantischen und syntaktischen Bezüge protokolliert sind. Dieses Wissen wird in Form einer tabellenartigen Struktur repräsentiert und zusammen mit den dazugehörigen Kommunikationsprimitiven in Kap. 3.3 beschrieben.
-
(3)
Prüfungen der konzeptuellen und operationellen Konstellationen, in die ein lexikalisches Element im Text eingebunden ist, machen den Spezifikationskern jedes Wortexperten aus. Daraus folgende (Zwischen-)Ergebnisse werden als interne Zustände einzelner Wortexperten in Form von Variablenbelegungen, Statusmeldungen, Anlaufbedingungen usf. akkumuliert und in geeigneter Weise in den Botschaftsaustausch zwischen einzelnen Wortexperten einbezogen. Deren Struktur wird in Kap. 3.2 eingehender betrachtet.
This is a preview of subscription content, log in via an institution.
Buying options
Tax calculation will be finalised at checkout
Purchases are for personal use only
Learn about institutional subscriptionsPreview
Unable to display preview. Download preview PDF.
Literature
Liskov/Zilles 1974.
Vollständige(re) Beschreibungen von FRM enthalten REIMER/HAHN 1985 und Reimer 1989.
Die damit realisierte Abstraktion für die Interaktionen des Wortexperten-Parsers mit der Systemkomponente, die das Weltwissen enthält (die sog. Weltwissensbasis), zählte bislang zu den hervorstechendsten methodischen Desiderata des Standardmodells (vgl. Small 1980, S.192–193; Adriaens 1986b, S.222–223).
Spezialisierungsrelationen und Attribution finden sich in ähnlicher Weise auch in der sortenlogischen Repräsentationssprache (M)SRL (HABEL/REDDIG/ROLLINGER 1981) wieder, die die semantische Zielsprache der in Eimermacher 1983a beschriebenen Wortexpertenentwicklung ist und die somit ebenfalls auf ein von der jeweiligen Wortexperten-Spezifikation unabhängiges Wissensrepräsentationssystem rekurriert.
Die Behandlung von Defaults befindet sich erst in einem explorativen Modellstadium; s. Reimer 1989, Kap.5.
Ebd., S.30–35. Referentielles Wissen hat in der hier betrachteten Textklasse im übrigen einen wesentlich geringeren Stellenwert als etwa in Frage-Antwort-System-Kontexten, da Produktbeschreibungen oder Testberichte stets den jeweiligen Prototypen zum Gegenstand haben und (wenn überhaupt) nur am Rande auf Auffälligkeiten des speziellen Testexemplars eingehen.
In diesem und in den Anschlußkapiteln 3.2 und 3.3 wird ergänzend zu den formalen Charakterisierungen der Wissensquellen durch Funktionen und Mengen eine diesen Beschreibungen entsprechende Darstellung im Kalkül der conceptual representations (CR) (vgl. Kap. 2.3 dieser Arbeit bzw. Yonezawa 1977, S.17–37) gegeben. Die Beschreibungen durch Funktionen und Mengen sind die Grundlage der Spezifikation des Vokabulars der Wortexperten in Kap. 3, während in Kap. 4 die Spezifikation der eigentlichen Textgrammatik auf den Beschreibungen der durch conceptual representations gegebenen Datenstrukturen beruht. Der Grund für diese Doppelgleisigkeit liegt in dem Versuch, beide Beschreibungen zu entkoppeln und für sich möglichst lesbar zu halten. Die hier beschriebenen Wissensquellen, aber mehr noch die auf ihnen ausführbaren Operationen sind somit in einem allgemeinverständlichen und weitverbreiteten Kalkül spezifiziert, die textgrammatische Spezifikation gewinnt demgegenüber durch die Verwendung von conceptual representations ihrerseits stark an Lesbarkeit. Die konsistente Transformation von Ausdrücken aus dem FOL- oder Funktionenkalkül in äquivalente CR-Ausdrücke wird hier nicht gezeigt. Aber mit den semantischen Restriktionen der zulässigen Werte für alle Komponenten einer solchen Darstellung (s.u.) ist die Anbindung an die Jeweils äquivalente FOL- oder Funktionendarstellung in hinreichender Weise festgelegt.
Die Ebene von individuellen Referenzobjekten wird hier nicht betrachtet; s. Reimer 1989, S.30–35.
Eine formale semantische Spezifikation geben REIMER/HAHN 1985, S.338 bzw. Reimer 19–89, S.41 und S.49/50.
Eine formale semantische Spezifikation geben REIMER/HAHN 1985, S.340 bzw. Reimer 1989. S.56/58.
Vgl. zur Illustration Appendix-3, die Bulletin-Positionen 009 und 157.
S. Reimer 1989, Kap. 4.2, S.99 zu einer semantischen Spezifikation.
S. Reimer 1989, Kap.4.2, S. 102–105, 106–107 zu einer semantischen Spezifikation.
S. Reimer 1989, Kap.4.2, S. 102–105 zu einer semantischen Spezifikation dieser Operation.
Dies entspricht den Rahmenbedingungen des TOPIC-Systems; vgl. HAHN/REIMER 1986 und Hahn 1990.
norm ist eine Funktion, die aus einem flektierten Texttoken die morphologische Normalform (Grundform) erzeugt. In der hier beschriebenen Version des Text-Parsers wird lediglich die Nominalflexion normalisiert (Verben und entsprechende Konjugationsformen werden nicht betrachtet) und entsprechende Grundformen erzeugt. Die in norm abgespaltenen Flexive werden nicht weiter betrachtet. Dies kann sich grundlegend ändern, wenn etwa weitergehende syntaktische Tests (etwa auf Kongruenz) durchgeführt werden müssen, d.h. Flexionsendungen parsing-relevant werden (bereits in den Formulierungen des Wortexperten-Standardmodells sind solche Flexiv-Experten spezifiziert worden; vgl. Small 1980, S.193–196 und Appendix B).
Trotz nahezu gleichlautender Namen hat das hier beschriebene “Parser-Bulletin”, dessen Grundfunktion die Protokollierung der Parser-Historie ist, kaum Ähnlichkeit mit dem bulletin board des Standardmodells des Wortexperten-Parsing (vgl. Rieger/Small 1979, S.725). Dort dient es eindeutig als globales Medium für vielfältige Steuerungsinformationen des Wortexperten-Parsers und enthält Zustandsbeschreibungen jedes einzelnen Wortexperten, des gesamten Parsers und Details der inkrementell aufgebauten Wissensrepräsentationsstrukturen — es besitzt in dieser Hinsicht viel Ähnlichkeit mit dem aus dem Hearsay-System bekannten blackboard-Konzept (vgl. Erman et al. 1980). Ein solch globales Steuerungsinstrument widerspricht nicht nur Prinzipien der Aktorenspezifikation, sondern ist spezifikationstechnisch auch unnötig, da Wortexperten nur gezielt miteinander kommunizieren (vgl. die Ausführungen zum Aktorenmodell als lokales Berechnungsmodell, Kap. 2.3). Wesentlich ausgeprägter ist dagegen die konzeptionelle Nähe des “Parser-Bulletins” zur blackboard (verschieden vom gleichnamigen Konzept in Hearsay!), wie sie in einer theoretischen Vorphase der Wortexper-ten-Modellierung in Small 1978, S.16 beschrieben ist und insbesondere der auch für die hier entwickelte Modellvariante wichtige Effekt der Bedeutungs- und Inferenzkonditionierung für nachfolgende Prozesse durch die Protokollierung der Parser-Historie eine wesentliche Rolle spielt.
Eine genau korrespondierende Beschreibung würde die Einführung zusätzlicher Konstrukte aus dem Kalkül der conceptual representations verlangen (vgl. Yonezawa 1977, S. 17–35), ohne daß daraus ein spürbarer Darstellungsgewinn für die hier zu beschreibenden Phänomene resultieren würde.
Beim momentanen Stand der Modellierung des Wortexperten-Parsers wird auf jede Form phrasenstruktureller Analysen verzichtet. Dies soll keine prinzipielle Einschränkung sein, reflektiert jedoch die Arbeitshypothese, daß linguistisch relevante Ko-Okkurrenzbeziehungen primär semantisch motiviert sind (vgl.a. Rieger 1978, S.97–98).
Eine Variante dieser Spezifikation, die das abgeleitete Thema mehrerer Absätze berechnet, gibt Hahn 1990.
Author information
Authors and Affiliations
Rights and permissions
Copyright information
© 1990 Springer-Verlag Berlin Heidelberg
About this chapter
Cite this chapter
Hahn, U. (1990). Strukturelle Beschreibung der Wissensquellen des Text-Parsers. In: Lexikalisch verteiltes Text-Parsing. Informatik-Fachberichte, vol 243. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-642-76132-4_3
Download citation
DOI: https://doi.org/10.1007/978-3-642-76132-4_3
Publisher Name: Springer, Berlin, Heidelberg
Print ISBN: 978-3-540-53230-9
Online ISBN: 978-3-642-76132-4
eBook Packages: Springer Book Archive