Skip to main content

Objekterkennung in einem selbstorganisierenden neuronalen System

  • Conference paper
Book cover Komplexe Systeme und Nichtlineare Dynamik in Natur und Gesellschaft

Zusammenfassung

Wir stellen hier ein System für invariante und robuste Erkennung von Objekten aus Kamerabildern vor. Das System beansprucht, sowohl ein Modell für biologisches Objektsehen (zumindest für eine ontogenetisch frühe Form davon) zu sein, als auch auf der Höhe des technischen Fortschritts zu stehen. Unser Modell basiert auf den Prinzipien zeitlicher Merkmalsbindung und schneller reversibler synaptischer Plastizität. Objekte werden in Form zweidimensionaler Ansichten gespeichert. Diese werden kompetitiv an Testbilder angepaßt. Während des Anpassungsprozesses werden vollständige Matrizen dynamischer Bindungen zwischen dem Bild und allen Modellen durch einen Prozeß rascher Selbstorganisation verfeinert, wobei im Endzustand nur noch einander entsprechende Punkte im Bild und in den Objektmodellen (besonders dem erkannten) verbunden sind. Als Datenformat für die Repräsentation von Bildern benutzen wir lokale Mengen („jets“) von Gabor-basierten Wavelets. Wir demonstrieren das Leistungsvermögen unseres Systems, indem wir es menschliche Gesichter wiedererkennen lassen, u.zw. aus Datenbasen von mehr als hundert Bildern. Das System ist invariant hinsichtlich retinaler Position und es ist robust hinsichtlich Kopfdrehung, Skalierung, Gesichtsdeformation und Beleuchtung.

Diese Arbeit erhielt Förderung vom deutschen Bundesministerium für Wissenschaft und Technologie (413-5839-01 IN 101 B/9), von AFOSR (F49620-93-1-0109), von der Europäischen Union (ERBCHRX-CT-930097) und vom Human Frontier Science Program. Das Originalmanuskript der Autoren wurde aus dem Englischen übersetzt von Theodor Leiber (Augsburg).

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Chapter
USD 29.95
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
eBook
USD 109.00
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
Softcover Book
USD 149.99
Price excludes VAT (USA)
  • Compact, lightweight edition
  • Dispatched in 3 to 5 business days
  • Free shipping worldwide - see info

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

Literatur

  1. Amari, S. (1977) Dynamics of pattern formation in lateral-inhibition type neural fields. Biological Cybernetics 27, 77–87

    Article  MathSciNet  MATH  Google Scholar 

  2. Anderson, C. H., Essen, D. C. V. (1987) Shifter circuits: A computational strategy for dynamic aspects of visual processing. Proceedings of the National Academy of the Sciences USA 84, 6297–6301

    Article  ADS  Google Scholar 

  3. Biederman, I. (1987) Recognition-by-components: A theory of human image understanding. Psychological Review 94, 115–147 (basic level object classifications can be made in 100 msec.)

    Article  Google Scholar 

  4. Biederman, I., Gerhardstein, P. C. (1993) Recognizing depth-rotated objects: Evidence and conditions for three-dimensional viewpoint invariance. Journal of Experimental Psychology 19, 1162–1182

    Google Scholar 

  5. Bruce, V., Valentine, T., Baddeley, A. (1987) The basis of the 3/4 view advantage in face recognition. Applied Cognitive Psychology 1, 109–120

    Article  Google Scholar 

  6. Buhmann, J., Lades, M., von der Malsburg, C. (1990) Size and distortion invariant object recognition by hierarchical graph matching. In: Proceedings of the IJCNN International Joint Conference on Neural Networks. IEEE, San Diego, pp. II 411–416

    Google Scholar 

  7. Crick, F. (1982) Do dendritic spines twitch? Trends in Neurobiology, February, pp. 44–46

    Google Scholar 

  8. Damasio, A. R., Damasio, H. (1992) Cortical systems underlying knowledge retrieval: Evidence from human lesion studies. In: Neurobiology of Neocortex. John Wiley, New York

    Google Scholar 

  9. Daugman, J. G. (1988) Complete discrete 2-d gabor transform by neural networks for image analysis and compression. IEEE Transactions on Acoustics, Speech and Signal Processing 36(7), 1169–1179

    Article  MATH  Google Scholar 

  10. Eigen, M. (1978) The hypercycle. Naturwissenschaften 65, 7–41

    Article  ADS  Google Scholar 

  11. Jones, J., Palmer, L. (1987) An evaluation of the two dimensional Gabor filter model of simple receptive fields in cat striate cortex. Journal of Neurophysiology 58, 1233–1258

    Google Scholar 

  12. Kalocsai, P., Biederman, I., Cooper, E. E. (1994) To what extent can the recognition of unfamiliar faces be accounted for by a representation of the direct output of simple cells. In: Proceedings of the Association for Research in Vision and Ophtal- mology, ARVO. Sarasota, Florida

    Google Scholar 

  13. Konen, W., Vorbrüggen, J. C. (1993) Applying dynamic link matching to object recognition in real world images. In: Gielen, S., Kappen, B. (eds.) (1993) Proceedings of the International Conference on Artificial Neural Networks, ICANN. Springer-Verlag, London, pp. 982–985

    Google Scholar 

  14. König, P., Engel, A. K. (1995) Correlated firing in sensory-motor systems. Current Opinion in Neurobiology 5, 511–519

    Article  Google Scholar 

  15. Lades, M. (1995) Invarient Object Recognition with Dynamical Links, Robust to Variations in Illumination. Doktorarbeit, Fakultät fÜ Physik und Astronomie, Ruhr-Universität Bochum, D-44780 Bochum

    Google Scholar 

  16. Lades, M., Vorbrüggen, J. C., Buhmann, J., Lange, J., von der Malsburg, C., Würtz, R. P., Konen, W. (1993) Distortion invariant object recognition in the dynamic link architecture. IEEE Transactions on Computers 42(3), 300–311

    Article  Google Scholar 

  17. Phillips, P. J., Moon, H., Rizvi, S., Rauss, P. (1998) The FERET Evaluation. In: Wechsler, H., Phillips, P. J., Bruce, V., Fogelman-Soulie, F., Huang, T. S. (eds.) Face Recognition: From Theory to Applications. Springer, Heidelberg

    Google Scholar 

  18. Rosenblatt, F. (1961) Principles of Neurodynamics: Perceptrons and the Theory of Brain Mechanisms. Spartan Books, Washington D.C

    Google Scholar 

  19. Subramaniam, S., Biederman, I., Kalocsai, P., Madigan, S. R. (1995) Accurate identification, but chance forced-choice recognition for rsvp pictures. In: Proceedings of the Association for Research in Vision and Ophtalmology, ARVO. Ft. Lauderdale, Florida

    Google Scholar 

  20. von der Malsburg, C. (1981) The correlation theory of brain function. Internal report 81–2, Max-Planck-Institut für Biophysikalische Chemie, Postfach 2841, 3400 Göttingen, FRG.Reprinted in Domany, E., van Hemmen, J. L., Schulten, K. (eds.) (1994) Models of Neural Networks II. Springer, Berlin, Chapter 2, pp. 95–119

    Google Scholar 

  21. von der Malsburg, C., Buhmann, J. (1992) Sensory segmentation with coupled neural oscillators. Biological Cybernetics 67, 233–242

    Article  MATH  Google Scholar 

  22. von der Malsburg, C., Reiser, K. (1995) Pose invariant object recognition in a neural system. In: Proceedings of the International Conference on Artificial Neural Networks ICANN 95. EC2 & Cie, Paris, pp. 127–132

    Google Scholar 

  23. Vorbrüggen, J. C. (1995) Data-driven segmentation of grey-level images with coupled nonlinear oscillators. In: Proceedings of the International Conference on Artificial Neural Networks ICANN 1995. EC2 & Cie, Paris, pp. 297–302

    Google Scholar 

  24. Wiskott, L. (1995) Labeled Graphs and Dynamic Link Matching for Face Recognition and Scene Analysis. PhD thesis. Vol. 53 of Reihe Physik. Verlag Harri Deutsch, Frankfurt am Main

    Google Scholar 

  25. Wiskott, L., Fellous, J.-M., Krüger, N., von der Malsburg, C. (1995) Face recognition and gender determination. In: Proceedings of the International Workshop on Automatic Face- and Gesture-Recognition, IWAFGR. Zürich, pp. 92–97

    Google Scholar 

  26. Wiskott, L., von der Malsburg, C. (1993) A neural system for the recognition of partially occluded objects in cluttered scenes. International Journal of Pattern Recognition and Artificial Intelligence 7(4), 935–948

    Article  Google Scholar 

  27. Zucker, R. S. (1989) Short-term synaptic plasticity. Annual Reviews of Neuros- cience 12, 13–31

    Article  Google Scholar 

Download references

Author information

Authors and Affiliations

Authors

Editor information

Editors and Affiliations

Rights and permissions

Reprints and permissions

Copyright information

© 1999 Springer-Verlag Berlin Heidelberg

About this paper

Cite this paper

Wiskott, L., von der Wiskott, C. (1999). Objekterkennung in einem selbstorganisierenden neuronalen System. In: Mainzer, K. (eds) Komplexe Systeme und Nichtlineare Dynamik in Natur und Gesellschaft. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-642-60063-0_10

Download citation

  • DOI: https://doi.org/10.1007/978-3-642-60063-0_10

  • Publisher Name: Springer, Berlin, Heidelberg

  • Print ISBN: 978-3-642-64240-1

  • Online ISBN: 978-3-642-60063-0

  • eBook Packages: Springer Book Archive

Publish with us

Policies and ethics