Zusammenfassung
Wir stellen hier ein System für invariante und robuste Erkennung von Objekten aus Kamerabildern vor. Das System beansprucht, sowohl ein Modell für biologisches Objektsehen (zumindest für eine ontogenetisch frühe Form davon) zu sein, als auch auf der Höhe des technischen Fortschritts zu stehen. Unser Modell basiert auf den Prinzipien zeitlicher Merkmalsbindung und schneller reversibler synaptischer Plastizität. Objekte werden in Form zweidimensionaler Ansichten gespeichert. Diese werden kompetitiv an Testbilder angepaßt. Während des Anpassungsprozesses werden vollständige Matrizen dynamischer Bindungen zwischen dem Bild und allen Modellen durch einen Prozeß rascher Selbstorganisation verfeinert, wobei im Endzustand nur noch einander entsprechende Punkte im Bild und in den Objektmodellen (besonders dem erkannten) verbunden sind. Als Datenformat für die Repräsentation von Bildern benutzen wir lokale Mengen („jets“) von Gabor-basierten Wavelets. Wir demonstrieren das Leistungsvermögen unseres Systems, indem wir es menschliche Gesichter wiedererkennen lassen, u.zw. aus Datenbasen von mehr als hundert Bildern. Das System ist invariant hinsichtlich retinaler Position und es ist robust hinsichtlich Kopfdrehung, Skalierung, Gesichtsdeformation und Beleuchtung.
Diese Arbeit erhielt Förderung vom deutschen Bundesministerium für Wissenschaft und Technologie (413-5839-01 IN 101 B/9), von AFOSR (F49620-93-1-0109), von der Europäischen Union (ERBCHRX-CT-930097) und vom Human Frontier Science Program. Das Originalmanuskript der Autoren wurde aus dem Englischen übersetzt von Theodor Leiber (Augsburg).
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Preview
Unable to display preview. Download preview PDF.
Literatur
Amari, S. (1977) Dynamics of pattern formation in lateral-inhibition type neural fields. Biological Cybernetics 27, 77–87
Anderson, C. H., Essen, D. C. V. (1987) Shifter circuits: A computational strategy for dynamic aspects of visual processing. Proceedings of the National Academy of the Sciences USA 84, 6297–6301
Biederman, I. (1987) Recognition-by-components: A theory of human image understanding. Psychological Review 94, 115–147 (basic level object classifications can be made in 100 msec.)
Biederman, I., Gerhardstein, P. C. (1993) Recognizing depth-rotated objects: Evidence and conditions for three-dimensional viewpoint invariance. Journal of Experimental Psychology 19, 1162–1182
Bruce, V., Valentine, T., Baddeley, A. (1987) The basis of the 3/4 view advantage in face recognition. Applied Cognitive Psychology 1, 109–120
Buhmann, J., Lades, M., von der Malsburg, C. (1990) Size and distortion invariant object recognition by hierarchical graph matching. In: Proceedings of the IJCNN International Joint Conference on Neural Networks. IEEE, San Diego, pp. II 411–416
Crick, F. (1982) Do dendritic spines twitch? Trends in Neurobiology, February, pp. 44–46
Damasio, A. R., Damasio, H. (1992) Cortical systems underlying knowledge retrieval: Evidence from human lesion studies. In: Neurobiology of Neocortex. John Wiley, New York
Daugman, J. G. (1988) Complete discrete 2-d gabor transform by neural networks for image analysis and compression. IEEE Transactions on Acoustics, Speech and Signal Processing 36(7), 1169–1179
Eigen, M. (1978) The hypercycle. Naturwissenschaften 65, 7–41
Jones, J., Palmer, L. (1987) An evaluation of the two dimensional Gabor filter model of simple receptive fields in cat striate cortex. Journal of Neurophysiology 58, 1233–1258
Kalocsai, P., Biederman, I., Cooper, E. E. (1994) To what extent can the recognition of unfamiliar faces be accounted for by a representation of the direct output of simple cells. In: Proceedings of the Association for Research in Vision and Ophtal- mology, ARVO. Sarasota, Florida
Konen, W., Vorbrüggen, J. C. (1993) Applying dynamic link matching to object recognition in real world images. In: Gielen, S., Kappen, B. (eds.) (1993) Proceedings of the International Conference on Artificial Neural Networks, ICANN. Springer-Verlag, London, pp. 982–985
König, P., Engel, A. K. (1995) Correlated firing in sensory-motor systems. Current Opinion in Neurobiology 5, 511–519
Lades, M. (1995) Invarient Object Recognition with Dynamical Links, Robust to Variations in Illumination. Doktorarbeit, Fakultät fÜ Physik und Astronomie, Ruhr-Universität Bochum, D-44780 Bochum
Lades, M., Vorbrüggen, J. C., Buhmann, J., Lange, J., von der Malsburg, C., Würtz, R. P., Konen, W. (1993) Distortion invariant object recognition in the dynamic link architecture. IEEE Transactions on Computers 42(3), 300–311
Phillips, P. J., Moon, H., Rizvi, S., Rauss, P. (1998) The FERET Evaluation. In: Wechsler, H., Phillips, P. J., Bruce, V., Fogelman-Soulie, F., Huang, T. S. (eds.) Face Recognition: From Theory to Applications. Springer, Heidelberg
Rosenblatt, F. (1961) Principles of Neurodynamics: Perceptrons and the Theory of Brain Mechanisms. Spartan Books, Washington D.C
Subramaniam, S., Biederman, I., Kalocsai, P., Madigan, S. R. (1995) Accurate identification, but chance forced-choice recognition for rsvp pictures. In: Proceedings of the Association for Research in Vision and Ophtalmology, ARVO. Ft. Lauderdale, Florida
von der Malsburg, C. (1981) The correlation theory of brain function. Internal report 81–2, Max-Planck-Institut für Biophysikalische Chemie, Postfach 2841, 3400 Göttingen, FRG.Reprinted in Domany, E., van Hemmen, J. L., Schulten, K. (eds.) (1994) Models of Neural Networks II. Springer, Berlin, Chapter 2, pp. 95–119
von der Malsburg, C., Buhmann, J. (1992) Sensory segmentation with coupled neural oscillators. Biological Cybernetics 67, 233–242
von der Malsburg, C., Reiser, K. (1995) Pose invariant object recognition in a neural system. In: Proceedings of the International Conference on Artificial Neural Networks ICANN 95. EC2 & Cie, Paris, pp. 127–132
Vorbrüggen, J. C. (1995) Data-driven segmentation of grey-level images with coupled nonlinear oscillators. In: Proceedings of the International Conference on Artificial Neural Networks ICANN 1995. EC2 & Cie, Paris, pp. 297–302
Wiskott, L. (1995) Labeled Graphs and Dynamic Link Matching for Face Recognition and Scene Analysis. PhD thesis. Vol. 53 of Reihe Physik. Verlag Harri Deutsch, Frankfurt am Main
Wiskott, L., Fellous, J.-M., Krüger, N., von der Malsburg, C. (1995) Face recognition and gender determination. In: Proceedings of the International Workshop on Automatic Face- and Gesture-Recognition, IWAFGR. Zürich, pp. 92–97
Wiskott, L., von der Malsburg, C. (1993) A neural system for the recognition of partially occluded objects in cluttered scenes. International Journal of Pattern Recognition and Artificial Intelligence 7(4), 935–948
Zucker, R. S. (1989) Short-term synaptic plasticity. Annual Reviews of Neuros- cience 12, 13–31
Author information
Authors and Affiliations
Editor information
Editors and Affiliations
Rights and permissions
Copyright information
© 1999 Springer-Verlag Berlin Heidelberg
About this paper
Cite this paper
Wiskott, L., von der Wiskott, C. (1999). Objekterkennung in einem selbstorganisierenden neuronalen System. In: Mainzer, K. (eds) Komplexe Systeme und Nichtlineare Dynamik in Natur und Gesellschaft. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-642-60063-0_10
Download citation
DOI: https://doi.org/10.1007/978-3-642-60063-0_10
Publisher Name: Springer, Berlin, Heidelberg
Print ISBN: 978-3-642-64240-1
Online ISBN: 978-3-642-60063-0
eBook Packages: Springer Book Archive