Zusammenfassung
Die vorliegende Arbeit hat zum Ziel, die Layout-Struktur beliebiger Dokumente aus deren Bildmatrix herauszumessen, in symbolischer Form darzustellen und hieraus bereits erste Rückschlüsse auf logische Zusammenhänge im Dokument zu ziehen. Hierzu werden die Dokumentmuster in die drei Klassen „Text“, „Grafik“ und „Bild“ eingeteilt. Um Muster der drei Klassen auf syntaktischem Wege zu erkennen, werden die Klassen durch Startsymbole ST, SG und SB dreier attributierter, stochastischer Grammatiken GRT, GRG und GRB repräsentiert. Jedes Dokumentmuster ist somit als Satz in einer der Sprachen L(GRT), L(GRG) oder L(GRB) enthalten. Die Produktionen der Grammatiken gliedern sieh in je einen syntaktischen, einen semantischen und einen stochastischen Anteil. Für die Aufgaben der Dokumentanalyse läßt sich der syntaktische wie auch der semantische Anteil der Grammatiken für die drei genannten Klassen identisch formulieren. Hierdurch ist jedes Dokumentmuster als Satz in jeder der drei Grammatiken enthalten. Die Produktionen, welche die terminalen Sätze der Klassen „Text“, „Grafik“ und „Bild“ erzeugen, unterscheiden sich lediglich in ihrer Stochastik voneinander.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Preview
Unable to display preview. Download preview PDF.
Author information
Authors and Affiliations
Rights and permissions
Copyright information
© 1987 Springer-Verlag Berlin Heidelberg
About this paper
Cite this paper
Scherl, W. (1987). Zielsetzung der Arbeit Überblick über den eigenen Lösungsweg. In: Bildanalyse allgemeiner Dokumente. Informatik-Fachberichte, vol 131. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-642-71657-7_3
Download citation
DOI: https://doi.org/10.1007/978-3-642-71657-7_3
Publisher Name: Springer, Berlin, Heidelberg
Print ISBN: 978-3-540-17214-7
Online ISBN: 978-3-642-71657-7
eBook Packages: Springer Book Archive