Skip to main content

Das Isadora-System — ein akustisch-phonetisches Netzwerk zur automatischen Spracherkennung

  • Conference paper
Mustererkennung 1991

Part of the book series: Informatik-Fachberichte ((INFORMATIK,volume 290))

Zusammenfassung

Das Isadora-System ist ein HMM-basiertes System zur Analyse von Sprachsignalen. Phonetische, morphologische und grammatische Spracheinheiten werden durch die Knoten eines hierarchischen Konstituentennetzes repräsentiert. Gewöhnliche Links-Rechts-Markovmodelle dienen der akustischen Modellierung minimaler Netzknoten, während die Modelle komplexerer Knoten durch geeignete Verknüpfungen (Hintereinander- und Parallelschaltung, Räckkopplung) kleinerer HMMs konstruiert werden.

Mit diesem Formalismus reduziert sich der Entwurf eines Spracherkennungsmoduls auf die Konstruktion eines geeigneten Netzes von Spracheinheiten. Durch den sukzessiven Aufbau neuer Netzknoten mithilfe obengenannter Verknüpfungen definieren wir etwa das Inventar der relevanten Wortuntereinheiten nebst der Struktur ihrer akustischen Modellierung, aber auch morphologische Strukturen, (reguläre) Satzgrammatiken und selbst das zu lösende Erkennungsproblem: verschiedene einschlägige Spracherkennungsaufgaben wie Einzel- und Verbundworterkennung, Phonemsegmentierung oder syntaxgesteuerte Satzerkennung sind im Isadora-System nicht „fest verdrahtet“, sondern geschehen durch die Anwendung des ViterbiAlgorithmus auf das Markovmodell geeignet strukturierter Netzknoten.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Chapter
USD 29.95
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
eBook
USD 44.99
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
Softcover Book
USD 59.99
Price excludes VAT (USA)
  • Compact, lightweight edition
  • Dispatched in 3 to 5 business days
  • Free shipping worldwide - see info

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

Literatur

  1. L. Bahl, P. Brown, P. deSouza, R. Mercer: A New Algorithm for the Estimation of Hidden Markov Model Parameters. In Proc. Int. Conf. on Acoustics, Speech, and Signal Processing, S. 493–496, 1988.

    Google Scholar 

  2. L. Baum: An Inequality and Associated Maximization Technique in Statistical Estimation for Probabilistic Functions of Markov Processes. Inequalities, 3: S. 1–8, 1972.

    Google Scholar 

  3. X. Huang, M. Jack: Semi-Continuous Hidden Markov Models for Speech Signals. Computer Speech & Language, 3 (3): S. 239–251, 1989.

    Article  Google Scholar 

  4. F. Jelinek, R. Mercer: Interpolated Estimation of Markov Source Parameters from Sparse Data. In E. Gelsema, L. Kanal (Editoren): Pattern Recognition in Practice, S. 381–397, North Holland, 1980.

    Google Scholar 

  5. B. Juang, L. Rabiner: Mixture Autoregressive Hidden Markov Models for Speech Signals. IEEE Trans. on Acoustics, Speech, and Signal Processing, 33 (6): S. 1404–1413, 1985.

    Article  MathSciNet  Google Scholar 

  6. K. Lee: Automatic Speech Recognition, The Development of the SPHINX System. Kluwer Academic Publishers, Boston, Dordrecht, London, 1989.

    Google Scholar 

  7. B. Lowerre, D. Reddy: The Harpy Speech Understanding System. In W. Lea (Editor): Trends in Speech Recognition, S. 340–360, Prentice-Hall Inc., Englewood Cliffs, New Jersey, 1980.

    Google Scholar 

  8. II. Ney: The Use of a One-stage Dynamic Programming Algorithm for Connected Word Reco- gnition. IEEE Trans. on Acoustics, Speech, and Signal Processing, 32: S. 263–271, 1984.

    Article  Google Scholar 

  9. H. Ney: Spracherkennung mit stochastischen Grammatiken. In E. Paulus (Editor): Mustererkennung 87 (9. DAGM Symposium), S. 118–122, Springer, 1987.

    Google Scholar 

  10. A. Paeseler, II. Ney: Continuous Speech Recognition Using a Stochastic Language Model. In Proc. Int. Conf. on Acoustics, Speech, and Signal Processing, S. 719–721, Glasgow, 1989.

    Google Scholar 

  11. L. Rabiner: Mathematical Foundations of Hidden Markov Models. In H. Niemann, M. Lang, G. Sagerer (Editoren): Recent Advances in Speech Understanding and Dialog Systems, S. 183205, Springer, 1988.

    Google Scholar 

  12. G. Rigoll: An Information Theory Approach to Speaker Adaptation. In Proc. European Conf. on Speech Technology, S. 494–497, 1989.

    Google Scholar 

  13. S. Young, C. Proctor: The Design and Implementation of Dialogue Control in Voice Operated Database Inquiry Systems. Computer Speech & Language, 3 (4): S. 329–353, 1989.

    Article  Google Scholar 

Download references

Author information

Authors and Affiliations

Authors

Editor information

Editors and Affiliations

Rights and permissions

Reprints and permissions

Copyright information

© 1991 Springer-Verlag Berlin Heidelberg

About this paper

Cite this paper

Schukat-Talamazzini, E.G., Niemann, H. (1991). Das Isadora-System — ein akustisch-phonetisches Netzwerk zur automatischen Spracherkennung. In: Radig, B. (eds) Mustererkennung 1991. Informatik-Fachberichte, vol 290. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-662-08896-8_32

Download citation

  • DOI: https://doi.org/10.1007/978-3-662-08896-8_32

  • Publisher Name: Springer, Berlin, Heidelberg

  • Print ISBN: 978-3-540-54597-2

  • Online ISBN: 978-3-662-08896-8

  • eBook Packages: Springer Book Archive

Publish with us

Policies and ethics