Advertisement

Zur Aufwandsabschätzung bei der Entwicklung eines Indexierungswörterbuches

  • Kostas Tzeras
Part of the Informatik-Fachberichte book series (INFORMATIK, volume 289)

Zusammenfassung

Für die automatische Indexierung mit einem vorgegebenen Deskriptorensystem wird ein Wörterbuch benötigt, das möglichst viele Fachausdrücke des Anwendungsgebietes durch Relationen mit Deskriptoren verbindet. Werden die in einem solchen Indexierungswörterbuch erfaßten Relationen aus der Verarbeitung von Texten gewonnen, so ergibt sich eine Beziehung zwischen der Anzahl der Texte und der Größe und Leistungsfähigkeit des Wörterbuches. Die Beschreibung derartiger Beziehungen ist besonders vor Beginn der Entwicklung eines automatischen Indexierungssystems von großem Interesse. H. Hüther hat sich in mehreren Arbeiten mit diesem Problem beschäftigt und verschiedene Schätzverfahren theoretisch hergeleitet. Für eines der von ihm vorgeschlagenen Schätzverfahren zur Abschätzung der Größe eines Indexie-rungswörterbuches in Abhängigkeit von der Anzahl der zugrundeliegenden Texte werden im vorliegenden Beitrag die Leistungsfähigkeit und die Anwendbarkeit untersucht.

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

Literatur

  1. Beinke-Geiser, U.; Lustig, G.; Futze-Meier, G. (1986). Indexieren mit dem System DAISY. In: Lustig, G. (ed.): Automatische Indexierung zwischen Forschung und Anwendung, pages 73–97. Olms, Hildesheim.Google Scholar
  2. Faißt, S. (1990). Entwicklung von Indexierungsfunktionen auf der Basis probabilistischer Entscheidungsbäume. Diplomarbeit, TH Darmstadt, FB Informatik, Datenverwaltungssysteme I I.Google Scholar
  3. Fuhr, N.; Hüther, H. (1989). Optimum Probability Estimation from Empirical Distributions. Information Processing and Management 25 (5), pages 493 - 507.CrossRefGoogle Scholar
  4. Fuhr, N.; Jäger-Beck, R.; Schwantner, M. (1986). Die Gewinnung von statistischen Relationen zwischen Terms und Deskriptoren. In: Lustig, G. (ed.): Automatische Indexierung zwischen Forschung und Anwendung, pages 43–51. Olms, Hildesheim.Google Scholar
  5. Fuhr, N.; Hartmann, S.; Knorz, G.; Lustig, G.; Schwantner, M.; Tzeras, K. (1991). AIR/X — a Rule-Based Multistage Indexing System for Large Subject Fields. In: Proceedings of the RIAO’91, Barcelona, Spain, April 2–5, 1991.Google Scholar
  6. Hüther, H. (1989). Wachstumsfunktionen in der automatischen Indexierung. Dissertation, TH Darmstadt, FB Informatik, Datenverwaltungssysteme I I.Google Scholar
  7. Hüther, H. (1990). On the Interrelationship of Dictionary Size and Completeness. In: Vidick, J.-L. (ed.): Proceedings of the 18th International Conference on Research and Development in Information Retrieval, pages 313–326. ACM, New York.Google Scholar
  8. Knorz, G. (1983). Automatisches Indexieren als Erkennen abstrakter Objekte. Niemeyer, Tübingen.Google Scholar
  9. Lustig, G. (ed.) (1986). Automatische Indexierung zwischen Forschung und Anwendung. Olms, Hildesheim.Google Scholar
  10. Pfeifer, U. (1990). Entwicklung log-linearer und linear-iterativer Indexierungsfunktionen. Diplomarbeit, TH Darmstadt, FB Informatik, Datenverwaltungssysteme I I.Google Scholar
  11. Tzeras, K. (1988). Schätzfunktionen för die Relation Z. Diplomarbeit, TH Darmstadt, FB Infor-matik, Datenverwaltungssysteme II.Google Scholar

Copyright information

© Springer-Verlag Berlin Heidelberg 1991

Authors and Affiliations

  • Kostas Tzeras
    • 1
  1. 1.Fachbereich Informatik Fachgebiet Datenverwaltungssysteme IITechnische Hochschule DarmstadtDarmstadtGermany

Personalised recommendations